شراكة Lightricks-Shutterstock تضع معايير جديدة لترخيص بيانات تدريب الذكاء الاصطناعي

Bitget App

تداول بذكاء

Mpost2024/12/24 01:22

By:Mpost

Lightricks أعلنت شركة أمازون، الشركة الرائدة في مجال برمجيات إنشاء المحتوى بالذكاء الاصطناعي، أنها أبرمت صفقة جديدة للحصول على إمكانية الوصول إلى شترستوك مكتبة ضخمة من أصول الفيديو تحت رخصة بحثية جديدة وهو ما يعزز جهود تدريب الذكاء الاصطناعي دون أي مشاكل تتعلق بانتهاك حقوق النشر.

تم تصميم الترخيص الجديد لمساعدة الشركات الناشئة في مجال الذكاء الاصطناعي على التغلب على أحد أكبر التحديات التي تواجهها - ألا وهو الافتقار إلى البيانات المتاحة لتدريب نماذجها. بدلاً من اللجوء إلى التكتيك المشكوك فيه قانونيًا وأخلاقيًا المتمثل في "استخراج" البيانات من الإنترنت العام، كما هو معروف عن الآخرين، تم تفويض Lightricks لتدريب نموذج الفيديو LTXV القوي على مجموعة أصغر من مقاطع الفيديو عالية الدقة.

سيساعد هذا Lightricks على تعزيز قدرة نموذج LTXV على تحقيق حركة وبنية أكثر اتساقًا عبر مقاطع الفيديو الطويلة مع الحفاظ على الجودة والدقة، وهو ما أثبت أنه يشكل تحديًا هائلاً في الصناعة.

صعود Lightricks السريع إلى طليعة الفيديو بالذكاء الاصطناعي

ويؤكد الإعلان على الديناميكية التي دفعت Lightricks إلى صفوف شركات التكنولوجيا المبتكرة التي تحاول تعطيل صناعة الذكاء الاصطناعي التوليدية التي تهيمن عليها الشركات المتعددة الجنسيات.

تهدف شركة Lightricks، التي بدأت حياتها كمطور لتطبيق تحرير الصور الشهير للمستهلكين المسمى Facetune، إلى تحويل نفسها إلى قوة في مجال الذكاء الاصطناعي، مع التركيز بشكل خاص على مساعدة المسوقين وصناع الأفلام.

وقد اتخذت الشركة خطوات كبيرة في هذا الاتجاه عندما استحوذت على منصة التسويق التي تركز على المؤثرين Popular Pays، والتي قامت فرق منتجات Lightricks لاحقًا بتعزيزها بأدوات الذكاء الاصطناعي لبناء ملخصات إبداعية وفحص المبدعين مع مراعاة مخاوف سلامة العلامة التجارية.

مع ظهور LTX Studio في أوائل عام 2024، وهو تطبيق ويب قوي لسرد القصص بالفيديو للمبدعين والذي يعمل الآن بنموذج إنشاء الفيديو LTXV مفتوح المصدر، دخلت Lightricks السوق قبل عدة أشهر OpenAI تمكنت الشركة من جعل تطبيقها الخاص لإنشاء الفيديو، Sora، متاحًا للجمهور.

على الرغم من الضرب OpenAIإلى جانب Google وMeta، تواجه Lightricks العديد من المنافسين الآخرين في مجال إنشاء مقاطع الفيديو بالذكاء الاصطناعي، حيث تتنافس مع شركات ناشئة مثل Pika Labs وLuma وRunway.

ضجة حول أساليب تدريب الذكاء الاصطناعي غير الأخلاقية

مع وجود العديد من الشركات التي تتنافس في مجال إنشاء مقاطع الفيديو باستخدام الذكاء الاصطناعي، فإن العامل الحاسم بالنسبة للعديد من الفرق الإبداعية سيكون على الأرجح قدرات نماذج اللغة الكبيرة الأساسية الخاصة بها. والطريقة الوحيدة لجعل برنامج ماجستير إدارة الأعمال أكثر قوة هي الاستمرار في تدريبه، وهذا يتطلب كميات هائلة من البيانات.

لقد أدى التعطش لمزيد من بيانات التدريب إلى جدال حاد، حيث اختارت العديد من شركات الذكاء الاصطناعي استخراج البيانات من الإنترنت دون أي اعتبار لقضايا حقوق النشر المتعلقة باستخدام تلك البيانات. لكن الممارسة مثيرة للجدال للغاية. في حين أن أمثال OpenAI في حين يزعم كل من موقع "إنثروبيك" و"فيسبوك" أن جمع البيانات ضروري لتطوير الذكاء الاصطناعي للجميع، يشكو الفنانون والمبدعون والكتاب وشركات الإعلام من تعرضهم للاستغلال ويصرون على أن ما يفعلونه غير قانوني.

وقد أدى ذلك إلى نقاش ساخن - هل ينبغي السماح لشركات الذكاء الاصطناعي باستهلاك أي أعمال محمية بحقوق الطبع والنشر تريدها لتسريع تطوير نماذجها، أم ينبغي إلزامها بالحصول على إذن وتعويض أولئك الذين أنشأوها؟

سابق OpenAI توصل الباحث سوشير بالاجي إلى الاستنتاج الأخير، بعد أن أشرف على جهود الشركة لتجميع بيانات التدريب. وقد قال: شارك في كشط كل شيء من أرشيفات الكتب المقرصنة إلى المحتوى الذي ينشئه المستخدمون على وسائل التواصل الاجتماعي وحتى المحتوى المخفي خلف جدران الدفع، دون الحصول على إذن على الإطلاق.

OpenAI افترض أنه إذا تم نشر البيانات على الإنترنت وإتاحتها مجانًا، فهي لعبة عادلة.

وافق بالاجي في البداية على هذا الموقف، لكنه أخبر نيويورك تايمز أنه بدأ في وقت لاحق في التشكيك في الأمر، قبل أن يخلص إلى أن الشركة تنتهك قانون حقوق النشر. وهو يعتقد أن التقنيات مثل ChatGPT وقال إن هذا كان السبب الرئيسي وراء قراره بالاستقالة من الشركة في وقت سابق من هذا العام.

من الواضح أن استخراج البيانات غير مستدام

وعلى الرغم من أن نيويورك تايمز , سوني ميوزيك وغيرها وبينما يلجأ صانعو البيانات الآن إلى اتخاذ إجراءات قانونية ضد العديد من شركات الذكاء الاصطناعي الرائدة، فقد رأينا ما يبدو أنه اعتراف ضمني من جانب الصناعة بأن ممارسات جمع البيانات هذه لن تكون مستدامة على المدى الطويل.

ويبدو أن شركات الذكاء الاصطناعي وخبراء الأخلاق ومنشئي المحتوى قد توصلوا إلى تفاهم، وقد ظهرت طوفان من التقارير حول صفقات ترخيص المحتوى الجديدة التي ستمنح الشركات إمكانية الوصول إلى مواد الشركات حتى تتمكن من تدريب نماذج الذكاء الاصطناعي الخاصة بها بطريقة لا تثير أسئلة قانونية وأخلاقية.

ويبدو أن ناشري الأخبار هم من بين الأكثر حماسًا، حيث أعلنت أمثال وكالة أسوشيتد برس، وأكسل سبرينغر، وفاينانشال تايمز، ونيوز كورب، ولوموند، وتايم، وأتلانتيك، أنها أبرمت صفقات مع OpenAI والشركات المنافسة. ولكن ليس فقط المؤسسات الإخبارية هي التي تفعل هذا. على سبيل المثال، OpenAI وقد تم تأمينها أيضًا صفقة مع ريديت للوصول إلى منتديات الإنترنت الواسعة بحثًا عن المزيد من بيانات التدريب.

لدى Getty Images، منافس Shutterstock، تبنت هذا الاتجاه كما تتعاون الشركة مع شركة Picsart الناشئة في مجال توليد الصور لمساعدتها في تطوير نموذج جديد يتم تدريبه حصريًا على المحتوى المرخص له. وتهدف الشركة إلى جذب المسوقين والشركات الصغيرة من خلال مفهوم "الصور المولدة بالذكاء الاصطناعي الآمنة تجاريًا".

Shutterstock ليس جديدًا في هذا الأمر، وقد كان يعمل مع OpenAI لبعض الوقت. وافقت في البداية على السماح OpenAI تدريب نموذج توليد الصور DALL-E على محتواه في عام 2021، وفي العام الماضي مدد تلك الصفقة لمدة ست سنوات أخرى.

وفي الوقت نفسه، قالت شركة Runway AI، وهي شركة رائدة أخرى في مجال توليد الفيديو، في سبتمبر/أيلول إنها تعمل مع استوديو هوليوود Lionsgate تدريب نماذجها على مكتبة الأفلام والبرامج التلفزيونية الواسعة التي تملكها الشركة والتي تضم أكثر من 20,000 ألف عنوان.

نموذج ترخيص أكثر سهولة في الوصول

ما يميز اتفاقية Lightricks مع Shutterstock هو أن شركة الذكاء الاصطناعي لن تضطر إلى دفع مبالغ باهظة للوصول إلى مكتبة الفيديو، وذلك بفضل طبيعة ترخيص البحث الأكثر مرونة.

أوضحت شركة Lightricks أن الصفقة تسمح لباحثي الشركة بتحسين وتنقيح نموذج LTXV باستخدام بيانات مرخصة عالية الجودة. سيمكن هذا النهج الذي يركز على البحث للوصول إلى البيانات من تطوير LTXV بطريقة أكثر فعالية من حيث التكلفة، وهو نموذج يمكن أن يجذب شركات ناشئة أخرى في مجال الذكاء الاصطناعي والتي قد تكافح من أجل تحمل تكاليف البيانات المرخصة.

ويضمن ترخيص البحث أيضًا حصول المساهمين على تعويضات، حيث يحصلون على 20% من الإيرادات من أي صفقات ترخيص بيانات، كما أن لديهم أيضًا خيار إلغاء الاشتراك تمامًا.

قال دانييل مانديل، رئيس قسم تراخيص البيانات والذكاء الاصطناعي العالمي في شركة Shutterstock، لموقع VentureBeat إن الشركة أنشأت ترخيص البحث الخاص بها لأنها تعتقد أن الاستثمار المالي لا ينبغي أن يكون حاجزا "إن الرسالة المهمة هنا هي أن الشركات، بغض النظر عن حجمها أو تمويلها، لم يعد لديها عذر لجمع محتوى غير مرخص لأغراض التدريب"، كما قال.