Cogeneration of innovative audio-visual content: A new challenge for computing art
एआई-आधारित दृश्य कला पीढ़ी का सारांश।श्रेय: बीजिंग झोंगके जर्नल पब्लिशिंग कंपनी

वाल्टर बेंजामिन 1936 में यांत्रिक प्रतियों के बजाय कलाकारों द्वारा बनाई गई मूल कलाकृतियों के मूल्य का वर्णन करने के लिए "द वर्क ऑफ आर्ट इन द एज ऑफ मैकेनिकल रिप्रोडक्शन" में आभा और प्रामाणिकता के साथ आए।वह कृत्रिमता की रक्षा करना और पारंपरिक ललित कलाओं का समर्थन करना चाहते थे।

अकेले नहीं, बल्कि जोड़ियों में, मिशेल की मुख्य चिंता "व्हाट डू पिक्चर्स वांट?: द लाइव्स एंड लव्स ऑफ इमेजेज" (2005) में बायोसाइबरनेटिक पुनरुत्पादन के युग में कला के काम के बारे में थी, जो बेंजामिन की विचारधारा का अनुसरण करती थी।उन्होंने विशेष रूप से पहली क्लोन भेड़, डॉली का उल्लेख किया और इसे एक जीवित छवि के रूप में माना।मिशेल कला और मानव विज्ञान में सबसे अधिक प्रतिनिधि और प्रभावशाली सिद्धांतकारों में से एक हैं।

उन्होंने बायोसाइबरनेटिक कलाकृतियों के मूल्य को समझाने के लिए अवधारणाओं की एक श्रृंखला विकसित की।हालाँकि, कार्बन पर आधारित, इस क्षेत्र के कलाकार जैव प्रौद्योगिकी के विकास से सीमित हैं, और उनकी रचना कभी-कभी जारी होने के बजाय दमित हो जाती है।जीवविज्ञानियों और कलाकारों के बीच कुछ निराशाजनक सहयोग दृश्य संस्कृति का मनोरंजन करके वैज्ञानिक ज्ञान को लोकप्रिय बनाते हैं और आलोचनात्मक सोच की कमी दर्शाते हैं।इसलिए, शोधकर्ताओं को इस बात पर विचार करने की ज़रूरत है कि कलाकार उन्नत तकनीक के साथ क्या कर सकते हैं।

मेटावर्स के युग में इंसानों को नई चुनौतियों का सामना करना पड़ा है।मनुष्यों के पास न केवल कलाकृतियों या बायोसाइबरनेटिक प्रतिकृतियों की यांत्रिक प्रतियां हैं, बल्कि स्वयं मनुष्यों के अवतार भी हैं।

कागज़मेंमशीन इंटेलिजेंस रिसर्चकृत्रिम बुद्धिमान (एआई) कला की अवधारणा का प्रस्ताव करता है, इस प्रकार कृत्रिम बुद्धिमान प्रौद्योगिकी द्वारा उत्पादित कलाकृतियों की मुख्य विशेषताओं का सारांश देता है, जैसे विस्तारित वास्तविकता (एक्सआर, वीआर/एआर/एमआर का संयोजन), साइबर-भौतिक प्रणाली (सीपीएस), क्लाउडकंप्यूटिंग, और ब्लॉकचेन।

एआई तकनीकी कर्मचारियों और कलाकारों के बीच सहयोग जीवविज्ञानी और कलाकारों के बीच की तुलना में अधिक घनिष्ठ है।एआई तकनीक कलाकारों को श्रमसाध्य काम से मुक्ति दिलाती है, जिस पर मुख्य रूप से मार्क्स और अन्य लोगों ने आरोप लगाया था, और उन्हें कला में अपनी पूरी क्षमता का एहसास करने के लिए प्रोत्साहित करती है।नतीजतन, एआई टीम में एक सक्षम भागीदार की तरह है जो हमेशा कलाकार को समय पर समझता है और कलाकार की रोमांटिक कल्पना को वास्तविकता में लाने के लिए गहन कार्य करता है।

विकास की उज्ज्वल संभावनाओं के साथ, एआई तकनीक कला क्षेत्रों में डिजाइन, निर्माण और प्रदर्शनी में आवश्यक भूमिका निभाती है।एआई कला की अवधारणा को कंप्यूटर कला के साथ आसानी से भ्रमित किया जा सकता है।यह ध्यान रखना महत्वपूर्ण है कि एआई कला कंप्यूटर कला से अधिक उन्नत है और ऑप्टिकल और ध्वनिक आवश्यकताओं सहित अधिक अवधारणात्मक आवश्यकताओं को कवर कर सकती है।एआई कला आमतौर पर मानवीय इंद्रियों का मिश्रण प्रस्तुत करती है।

कला की सराहना करने वाले दृश्य, श्रवण और सामरिक भावनाओं को एक साथ प्राप्त करते हैं।दूसरे शब्दों में, एआई तकनीक आधुनिक कला प्रदर्शनियों के लिए एक समृद्ध ऑडियो-विजुअल दावत प्रदान करती है।

एआई कला के लिए विकास योजना अभी भी प्रारंभिक अवस्था में है।एआई प्रौद्योगिकी की सामान्य प्रयोज्यता के बारे में समाज में कुछ चिंताएँ हैं।यहां एक दिलचस्प सवाल है जिसका हमेशा उल्लेख किया गया है।क्या AI विद्युत भेड़ का सपना देखता है?1968 में, फिलिप के. डिक ने पहली बार अपने विज्ञान कथा में इस प्रश्न को सामने रखा: "क्या एंड्रॉइड इलेक्ट्रिक भेड़ का सपना देखते हैं?""ब्लेड रनर" और "ब्लेड रनर 2049" फिल्मों की प्रेरणा।

एआई नैतिक मुद्दों पर चर्चा करने के बाद, यह शीर्षक मुख्य प्रश्न बन गया है जो इस डर का प्रतिनिधित्व करता है कि एआई मनुष्यों की जगह ले लेगा।इस तरह की आशंकाएं जल्द ही मानविकी में फैल गईं।कुछ बुद्धिजीवियों का मानना ​​है कि एआई तकनीक की सीमा होनी चाहिए।हालाँकि, अगर किसी को एआई तकनीक का पर्याप्त ज्ञान है, तो उसे ऐसे डर हास्यास्पद लगेंगे।लोगों का डर अज्ञात की अस्वीकृति से ज्यादा कुछ नहीं है।

अत्याधुनिक एआई तकनीक को अभी भी इंसानों के भावनात्मक स्तर तक पहुंचने की जरूरत है।एआई तकनीक को विकसित करने और लागू करने पर यथासंभव काम करने की तत्काल आवश्यकता बनी हुई है।

एआई तकनीक का उपयोग वर्तमान में कला क्षेत्र में तकनीक वर्गीकरण, शैली प्रवासन, इंटरैक्टिव डिजाइन, विनिर्माण, सांस्कृतिक उद्योग आदि के लिए किया जाता है।एआई कला ने एआई-जनित कविता, वीआर पेंटिंग, डिजिटल मीडिया कला, एआई वॉयसओवर और स्मार्ट विद्युत उपकरणों का उत्पादन किया है।ये उदाहरण एआई कला की ठोस रचनात्मक शक्ति को दर्शाते हैं।

हालांकि, कुछ कलाकार इससे खुश नहीं हैं.1972 में, जर्मन कलाकार जोसेफ बेयूस ने कसेल में डॉक्यूमेंटा में एक भाषण दिया, जिसमें यह विचार प्रस्तुत किया गया कि "हर कोई एक कलाकार है।"उनके इस विचार से हंगामा मच गया है.उन दिनों यह एक कल्पना से अधिक कुछ नहीं था।आख़िरकार, हर कोई कला बनाने में कुशल नहीं था।एआई कला के विकास के साथ, यह विचार वास्तविकता बनता दिख रहा है।एआई इतना शक्तिशाली है कि किसी को भी कलाकार बनने की अनुमति दे सकता है।

यह ध्यान दिया जाना चाहिए कि एआई की रचनात्मक क्षमता अनंत नहीं है।यह उन मनुष्यों से आता है जिनके पास कला बनाने की प्रतिभा है।इसलिए, एआई कला का विकास कलाकारों के प्रशिक्षण के साथ असंगत नहीं है।इसके विपरीत, एआई कला का प्रसार कलाकारों को वह करने में सक्षम बनाता है जो वे सबसे अच्छा करते हैं।इस तरह, एआई कला विकास और पारंपरिक कला नवाचार एक जीत की स्थिति रख सकते हैं।

लक्ष्य पर होने के लिए, पेकिंग विश्वविद्यालय के प्रोफेसर गाओ फेंग का एक पेपर एआई-जनरेटेड वीडियो और एआई-जनरेटेड ऑडियो पर केंद्रित है।श्रव्य-दृश्य क्षमता को अक्सर समग्र मानव संवेदी क्षमता के रूप में माना जाता है।उनके संयोजन ने फिल्मों, लघु वीडियो और गेम जैसे उद्योगों की उत्पादन क्षमता में तेजी से सुधार किया है।एआई दृश्य और श्रवण प्रौद्योगिकी का सारांश और मौजूदा परिणामों की प्रस्तुति उद्योग के चिकित्सकों को भविष्य में कला उद्योग के रुझान निर्धारित करने में मदद कर सकती है।

श्रव्य-दृश्य कला पीढ़ी को दृश्य कला पीढ़ी और श्रवण कला पीढ़ी में विभाजित किया जा सकता है।पेपर का खंड 2 दो क्षेत्रों में डेटासेट और विधियों का व्यापक अवलोकन प्रदान करता है।

दृश्य कला निर्माण भाग: सबसे पहले, शोधकर्ताओं ने दस क्लासिक छवि डेटासेट पेश किए;फिर, एआई पेंटिंग, स्टाइल ट्रांसफर और टेक्स्ट-टू-इमेज अनुवाद के तीन कार्यों के आधार पर, शोधकर्ता दृश्य सामग्री निर्माण के क्षेत्र में क्लासिक मॉडल का सारांश देते हैं;अंततः, शोधकर्ता इसके लिए विशिष्ट प्रणालियाँ और उत्पाद दिखाते हैं।

श्रवण कला निर्माण भाग: वे एक संकेतक के रूप में ध्वनि अभिव्यक्ति के रूप का उपयोग करते हैं, विशेष रूप से श्रवण कला निर्माण के क्षेत्र में आठ क्लासिक संगीत डेटासेट सूचीबद्ध करते हैं;फिर, मानक के रूप में मॉडल संरचना के संबंध में, संगीत निर्माण विधियों को दो श्रेणियों, सामान्य मॉडल और समग्र मॉडल में विभाजित किया गया है।शोधकर्ता संगीत निर्माण के लिए नौ शास्त्रीय रूपरेखाओं की रूपरेखा तैयार करते हैं और संबंधित मॉडलों और उत्पादों की पहचान करते हैं।

एल्गोरिथम प्रदर्शन के लिए दो प्रकार की मूल्यांकन विधियाँ हैं: वस्तुनिष्ठ मूल्यांकन और व्यक्तिपरक मूल्यांकन।वस्तुनिष्ठ मूल्यांकन गणितीय सिद्धांत पर आधारित कई मेट्रिक्स लागू करता है, जो मात्रात्मक, कुशल और व्यापक रूप से उपयोग किया जाता है, लेकिन यह उस सामग्री के लिए उपयुक्त नहीं है जिसके लिए व्यक्तिपरक भावनाओं की आवश्यकता होती है।व्यक्तिपरक मूल्यांकन के लिए आमतौर पर प्रयोगों के डिजाइन की आवश्यकता होती है, और पर्यवेक्षक एल्गोरिदम के परिणामों का मूल्यांकन करते हैं, जो समय लेने वाली, श्रमसाध्य और मात्रा निर्धारित करना कठिन है।

फिर भी, व्यक्तिपरक मूल्यांकन व्यक्तिपरक भावनाओं के अनुरूप है।कला सृजन के क्षेत्र में व्यक्तिपरक मूल्यांकन मॉडल की रचनात्मकता के मूल्यांकन में महत्वपूर्ण भूमिका निभाता है।धारा 3 में, शोधकर्ता वस्तुनिष्ठ और व्यक्तिपरक दृष्टिकोण से उत्पन्न परिणामों की गुणवत्ता को मापने का एक सिंहावलोकन प्रदान करते हैं।

धारा 4 प्रस्तावित सामग्रियों और तंत्र का परिचय देती है।श्रव्य-दृश्य सामग्री का सह-उत्पादन एक बहु-मॉडल कार्य है और इसके लिए छवि, वीडियो, ऑडियो, पाठ आदि सहित विभिन्न स्रोतों से जानकारी को संयोजित करने के दृष्टिकोण की आवश्यकता होती है। विभिन्न श्रव्य-दृश्य कला निर्माण एल्गोरिदम की ताकत और सीमाओं का आकलन करके, शोधकर्ता विकसित और प्रस्तावित करते हैं।कई प्रकार के एल्गोरिदम का उपयोग करके डिजिटल ऑडियो-विज़ुअल कलाकृतियां तैयार करने के लिए एक संयुक्त पीढ़ी तंत्र।

सिस्टम को दृश्य कला निर्माण मॉड्यूल और श्रवण कला पीढ़ी मॉड्यूल में विभाजित किया गया है।पूर्व एक निर्दिष्ट शैली की गतिशील वीडियो सामग्री उत्पन्न करने के लिए ज़िम्मेदार है, और बाद वाला वीडियो से जुड़े टेक्स्ट सुविधाओं के माध्यम से संबंधित वीडियो साउंडट्रैक उत्पन्न करता है।धारा 4.1 में, शोधकर्ता ऑडियो-विज़ुअल संयुक्त कार्यों के लिए निर्मित दो डेटासेट पेश करते हैं।अनुभाग 4.2 और 4.3 में वे क्रमशः दृश्य कला निर्माण मॉड्यूल और श्रवण कला उत्पादन मॉड्यूल प्रदर्शित करते हैं।

इस पेपर में श्रव्य-दृश्य कला निर्माण के तकनीकी विकास के परिणामों का सारांश दिया गया है।दृश्य-श्रव्य कला निर्माण की तकनीक के अनुप्रयोगों की एक विस्तृत श्रृंखला है।मनोरंजन को अधिक विविध बनाने के लिए इसका उपयोग घर पर किया जा सकता है।इसका उपयोग सार्वजनिक स्थानों पर भी किया जा सकता है।उदाहरण के लिए, यह व्यावसायिक प्रचार और कला प्रदर्शनियों का आकर्षण बढ़ा सकता है।

एक अध्ययन में एक नई संग्रहालय संग्रह प्रणाली का प्रस्ताव दिया गया है जो संग्रहालयों सहित कला संस्थानों की सेवा में एआई तकनीक लागू करती है।इस तरह के अध्ययन एआई-आधारित कंप्यूटिंग कला में व्यापक रुचि दिखाते हैं, जो लोगों के दैनिक जीवन को सुविधाजनक बना सकता है और सांस्कृतिक उद्योगों के विकास को सशक्त बना सकता है।

इसके अलावा, दृश्य कला पीढ़ी और श्रवण कला पीढ़ी कला के उत्पादन के तरीके में क्रांतिकारी बदलाव लाएगी और इसकी उत्पादकता बढ़ाएगी।हालाँकि, यह अनिवार्य रूप से कुछ चुनौतीपूर्ण मुद्दे प्रस्तुत करता है।पारंपरिक कलाकारों ने कंप्यूटिंग कला के विकास को लेकर बहुत चिंता दिखाई है।उन्हें डर है कि कंप्यूटर जल्द ही उनकी नौकरियों की जगह ले लेगा।यह चिंता अनुचित नहीं है.एआई तेजी से शारीरिक श्रम की जगह ले रहा है।

धारा 5 में दो पहलू शामिल हैं। एक ओर, शोधकर्ताओं को यह स्पष्ट करने की आवश्यकता है कि क्या कंप्यूटिंग कला कृत्रिम कला को प्रतिस्थापित करने के योग्य है।दूसरी ओर, शोधकर्ताओं को यह जानने की जरूरत है कि क्या कृत्रिम कला के बजाय कंप्यूटिंग कला समाज की भलाई के लिए अधिक फायदेमंद है।संक्षेप में, एआई-आधारित कंप्यूटिंग कला की मुख्य चुनौतियों को कंप्यूटिंग कला के कृत्रिम और बुद्धिमान पहलुओं के रूप में संक्षेपित किया जा सकता है।

इस पेपर ने श्रव्य-दृश्य सामग्री निर्माण पर एक व्यापक सर्वेक्षण प्रदान किया है।शोधकर्ताओं को उम्मीद है कि इस समीक्षा से लोगों को ऑडियो-विज़ुअल कला के अनुसंधान क्षेत्र और एआई-आधारित विकास की प्रवृत्ति को बेहतर ढंग से समझने में मदद मिलेगीपीढ़ी.मेंगटिंग लियू एट अल, इनोवेटिव ऑडियो-विज़ुअल सामग्री का सह-उत्पादन: कंप्यूटिंग कला के लिए एक नई चुनौती,

मशीन इंटेलिजेंस रिसर्च(2024)।डीओआई: 10.1007/एस11633-023-1453-5द्वारा उपलब्ध कराया गयाबीजिंग झोंगके जर्नल पब्लिशिंग कंपनी

उद्धरण

:नवीन श्रव्य-दृश्य सामग्री का सह-उत्पादन: कंप्यूटिंग कला के लिए एक नई चुनौती (2024, 22 मार्च)22 मार्च 2024 को पुनःप्राप्तhttps://techxplore.com/news/2024-03-cogeneration-audio-visual-content-art.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।