नया एआई मॉडल क्रॉस-मॉडैलिटी मशीन विज़न लर्निंग में बाधाओं को तोड़ता है

2024-09-24 19:53:44

हाल ही में, चाइनीज एकेडमी ऑफ साइंसेज के हेफ़ेई इंस्टीट्यूट ऑफ फिजिकल साइंस के प्रोफेसर वांग होंगकियांग के नेतृत्व में शोध दल ने एक व्यापक क्रॉस-मोडेलिटी मशीन विज़न एआई मॉडल का प्रस्ताव रखा।

New AI model breaks barriers in cross-modality machine vision learning — मॉडल के आधार पर क्रॉस-मोडेलिटी छवि पुनर्प्राप्ति वर्कफ़्लो।श्रेय: वांग होंगकियांग

इस मॉडल ने क्रॉस-मॉडैलिटी जानकारी को संभालने में पारंपरिक एकल-डोमेन मॉडल की सीमाओं को पार कर लिया और क्रॉस-मॉडैलिटी छवि पुनर्प्राप्ति तकनीक में नई सफलताएं हासिल कीं।

एआई में क्रॉस-मॉडैलिटी मशीन विज़न एक बड़ी चुनौती है, क्योंकि इसमें विभिन्न प्रकार के डेटा के बीच स्थिरता और संपूरकता खोजना शामिल है।पारंपरिक तरीके छवियों और विशेषताओं पर ध्यान केंद्रित करते हैं लेकिन सूचना की ग्रैन्युलैरिटी और डेटा की कमी जैसे मुद्दों से सीमित होते हैं।

पारंपरिक तरीकों की तुलना में, शोधकर्ताओं ने पाया कि विस्तृत संबंध सभी तौर-तरीकों में स्थिरता बनाए रखने में अधिक प्रभावी हैं।काम हैकी तैनातीतकarXivप्रीप्रिंट सर्वर.

अध्ययन में, टीम ने एक व्यापक सूचना खनन नेटवर्क (डब्ल्यूआरआईएम-नेट) पेश किया।इस मॉडल ने विभिन्न डोमेन, जैसे कि स्थानिक, चैनल और स्केल डोमेन में विस्तृत संघों को निकालने के लिए वैश्विक क्षेत्र इंटरैक्शन का निर्माण किया, जिसमें व्यापक रेंज में मोडैलिटी अपरिवर्तनीय सूचना खनन पर जोर दिया गया।

इसके अतिरिक्त, अनुसंधान टीम ने क्रॉस-मोडेलिटी कुंजी-इंस्टेंस कंट्रास्टिव लॉस को डिज़ाइन करके प्रभावी ढंग से मॉडेलिटी-अपरिवर्तनीय जानकारी निकालने के लिए नेटवर्क को निर्देशित किया।प्रायोगिक सत्यापन ने मानक और बड़े पैमाने पर क्रॉस-मोडेलिटी डेटासेट दोनों पर मॉडल की प्रभावशीलता को दिखाया, पहली बार कई प्रमुख प्रदर्शन मेट्रिक्स में 90% से अधिक हासिल किया।

इस मॉडल को कृत्रिम बुद्धिमत्ता के विभिन्न क्षेत्रों में लागू किया जा सकता है, जिसमें विज़ुअल ट्रैसेबिलिटी और पुनर्प्राप्ति भी शामिल हैचिकित्सा छवि विश्लेषण, टीम के अनुसार.

अधिक जानकारी:योंगगन वू एट अल, डब्ल्यूआरआईएम-नेट: दृश्यमान-इन्फ्रारेड व्यक्ति की पुनः पहचान के लिए व्यापक सूचना खनन नेटवर्क,arXiv(2024)।डीओआई: 10.48550/arxiv.2408.10624

जर्नल जानकारी: arXiv

उद्धरण:नया एआई मॉडल क्रॉस-मॉडैलिटी मशीन विज़न लर्निंग में बाधाओं को तोड़ता है (2024, 24 सितंबर)24 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-09-ai-barriers-modality-machine-vision.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।

अन्य भाषा संस्करण भी देखें: English | 简中 | 正體 | 日本語 | 한국인 | हिंदी | Español