New AI model breaks barriers in cross-modality machine vision learning
मॉडल के आधार पर क्रॉस-मोडेलिटी छवि पुनर्प्राप्ति वर्कफ़्लो।श्रेय: वांग होंगकियांग

हाल ही में, चाइनीज एकेडमी ऑफ साइंसेज के हेफ़ेई इंस्टीट्यूट ऑफ फिजिकल साइंस के प्रोफेसर वांग होंगकियांग के नेतृत्व में शोध दल ने एक व्यापक क्रॉस-मोडेलिटी मशीन विज़न एआई मॉडल का प्रस्ताव रखा।

इस मॉडल ने क्रॉस-मॉडैलिटी जानकारी को संभालने में पारंपरिक एकल-डोमेन मॉडल की सीमाओं को पार कर लिया और क्रॉस-मॉडैलिटी छवि पुनर्प्राप्ति तकनीक में नई सफलताएं हासिल कीं।

एआई में क्रॉस-मॉडैलिटी मशीन विज़न एक बड़ी चुनौती है, क्योंकि इसमें विभिन्न प्रकार के डेटा के बीच स्थिरता और संपूरकता खोजना शामिल है।पारंपरिक तरीके छवियों और विशेषताओं पर ध्यान केंद्रित करते हैं लेकिन सूचना की ग्रैन्युलैरिटी और डेटा की कमी जैसे मुद्दों से सीमित होते हैं।

पारंपरिक तरीकों की तुलना में, शोधकर्ताओं ने पाया कि विस्तृत संबंध सभी तौर-तरीकों में स्थिरता बनाए रखने में अधिक प्रभावी हैं।काम हैकी तैनातीतकarXivप्रीप्रिंट सर्वर.

अध्ययन में, टीम ने एक व्यापक सूचना खनन नेटवर्क (डब्ल्यूआरआईएम-नेट) पेश किया।इस मॉडल ने विभिन्न डोमेन, जैसे कि स्थानिक, चैनल और स्केल डोमेन में विस्तृत संघों को निकालने के लिए वैश्विक क्षेत्र इंटरैक्शन का निर्माण किया, जिसमें व्यापक रेंज में मोडैलिटी अपरिवर्तनीय सूचना खनन पर जोर दिया गया।

इसके अतिरिक्त, अनुसंधान टीम ने क्रॉस-मोडेलिटी कुंजी-इंस्टेंस कंट्रास्टिव लॉस को डिज़ाइन करके प्रभावी ढंग से मॉडेलिटी-अपरिवर्तनीय जानकारी निकालने के लिए नेटवर्क को निर्देशित किया।प्रायोगिक सत्यापन ने मानक और बड़े पैमाने पर क्रॉस-मोडेलिटी डेटासेट दोनों पर मॉडल की प्रभावशीलता को दिखाया, पहली बार कई प्रमुख प्रदर्शन मेट्रिक्स में 90% से अधिक हासिल किया।

इस मॉडल को कृत्रिम बुद्धिमत्ता के विभिन्न क्षेत्रों में लागू किया जा सकता है, जिसमें विज़ुअल ट्रैसेबिलिटी और पुनर्प्राप्ति भी शामिल है, टीम के अनुसार.

अधिक जानकारी:योंगगन वू एट अल, डब्ल्यूआरआईएम-नेट: दृश्यमान-इन्फ्रारेड व्यक्ति की पुनः पहचान के लिए व्यापक सूचना खनन नेटवर्क,arXiv(2024)।डीओआई: 10.48550/arxiv.2408.10624

जर्नल जानकारी: arXiv

उद्धरण:नया एआई मॉडल क्रॉस-मॉडैलिटी मशीन विज़न लर्निंग में बाधाओं को तोड़ता है (2024, 24 सितंबर)24 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-09-ai-barriers-modality-machine-vision.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।