हाल ही में, चाइनीज एकेडमी ऑफ साइंसेज के हेफ़ेई इंस्टीट्यूट ऑफ फिजिकल साइंस के प्रोफेसर वांग होंगकियांग के नेतृत्व में शोध दल ने एक व्यापक क्रॉस-मोडेलिटी मशीन विज़न एआई मॉडल का प्रस्ताव रखा।
इस मॉडल ने क्रॉस-मॉडैलिटी जानकारी को संभालने में पारंपरिक एकल-डोमेन मॉडल की सीमाओं को पार कर लिया और क्रॉस-मॉडैलिटी छवि पुनर्प्राप्ति तकनीक में नई सफलताएं हासिल कीं।
एआई में क्रॉस-मॉडैलिटी मशीन विज़न एक बड़ी चुनौती है, क्योंकि इसमें विभिन्न प्रकार के डेटा के बीच स्थिरता और संपूरकता खोजना शामिल है।पारंपरिक तरीके छवियों और विशेषताओं पर ध्यान केंद्रित करते हैं लेकिन सूचना की ग्रैन्युलैरिटी और डेटा की कमी जैसे मुद्दों से सीमित होते हैं।
पारंपरिक तरीकों की तुलना में, शोधकर्ताओं ने पाया कि विस्तृत संबंध सभी तौर-तरीकों में स्थिरता बनाए रखने में अधिक प्रभावी हैं।काम हैकी तैनातीतकarXivप्रीप्रिंट सर्वर.
अध्ययन में, टीम ने एक व्यापक सूचना खनन नेटवर्क (डब्ल्यूआरआईएम-नेट) पेश किया।इस मॉडल ने विभिन्न डोमेन, जैसे कि स्थानिक, चैनल और स्केल डोमेन में विस्तृत संघों को निकालने के लिए वैश्विक क्षेत्र इंटरैक्शन का निर्माण किया, जिसमें व्यापक रेंज में मोडैलिटी अपरिवर्तनीय सूचना खनन पर जोर दिया गया।
इसके अतिरिक्त, अनुसंधान टीम ने क्रॉस-मोडेलिटी कुंजी-इंस्टेंस कंट्रास्टिव लॉस को डिज़ाइन करके प्रभावी ढंग से मॉडेलिटी-अपरिवर्तनीय जानकारी निकालने के लिए नेटवर्क को निर्देशित किया।प्रायोगिक सत्यापन ने मानक और बड़े पैमाने पर क्रॉस-मोडेलिटी डेटासेट दोनों पर मॉडल की प्रभावशीलता को दिखाया, पहली बार कई प्रमुख प्रदर्शन मेट्रिक्स में 90% से अधिक हासिल किया।
इस मॉडल को कृत्रिम बुद्धिमत्ता के विभिन्न क्षेत्रों में लागू किया जा सकता है, जिसमें विज़ुअल ट्रैसेबिलिटी और पुनर्प्राप्ति भी शामिल हैचिकित्सा छवि विश्लेषण, टीम के अनुसार.
अधिक जानकारी:योंगगन वू एट अल, डब्ल्यूआरआईएम-नेट: दृश्यमान-इन्फ्रारेड व्यक्ति की पुनः पहचान के लिए व्यापक सूचना खनन नेटवर्क,arXiv(2024)।डीओआई: 10.48550/arxiv.2408.10624
जर्नल जानकारी: arXiv
उद्धरण:नया एआई मॉडल क्रॉस-मॉडैलिटी मशीन विज़न लर्निंग में बाधाओं को तोड़ता है (2024, 24 सितंबर)24 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-09-ai-barriers-modality-machine-vision.html से
यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।