در دنیای تکنولوژی و هوش مصنوعی، موضوعات مربوط به حقوق مالکیت معنوی و استفاده از محتوای دارای حقتکثیر همواره محل بحث و چالش بودهاند. طبق بررسی های کارشناسان شرکت سحاب اخیراً شکایتی از سوی نیویورک تایمز و دیلی نیوز علیه OpenAI مطرح شده که به اتهام استفاده بدون اجازه از محتوای این ناشران برای آموزش مدلهای هوش مصنوعی اشاره دارد. در این میان، اتفاقی بحثبرانگیز رخ داده که توجه بسیاری را به خود جلب کرده است.
حذف تصادفی دادهها توسط OpenAI
در پاییز امسال، OpenAI برای شفافسازی و همکاری با نیویورک تایمز و دیلی نیوز، موافقت کرد که دو ماشین مجازی در اختیار وکلای این ناشران قرار دهد. این ماشینها به وکلای شاکی اجازه میداد تا محتوای خود را در میان دادههای آموزشی OpenAI جستجو کنند.
(ماشینهای مجازی، کامپیوترهای نرمافزاری هستند که درون سیستمعامل یک کامپیوتر دیگر اجرا میشوند و اغلب برای آزمایش، پشتیبانگیری و اجرای برنامهها استفاده میشوند.)
وکلای ناشران اعلام کردند که آنها و کارشناسان استخدامیشان از اول نوامبر بیش از ۱۵۰ ساعت را صرف بررسی دادههای آموزشی کردهاند. اما در تاریخ ۱۴ نوامبر، OpenAI اعلام کرد که دادههای ذخیرهشده در یکی از ماشینهای مجازی بهطور تصادفی توسط مهندسان این شرکت حذف شده است.برای ادامه مطلب با ما در شرکت سحاب همراه شوید.
آیا بازیابی دادهها موفق بود؟
OpenAI پس از این اتفاق تلاش کرد دادههای حذفشده را بازیابی کند و در این کار تا حد زیادی موفق شد. اما مشکلی جدی باقی ماند: ساختار پوشهها و نام فایلها بهطور غیرقابلبازگشتی از بین رفته بود. این موضوع باعث شد که دادههای بازیابیشده عملاً غیرقابلاستفاده شوند، زیرا نمیتوانستند مشخص کنند کدام مقالات دارای حقتکثیر برای آموزش مدلها استفاده شدهاند.
وکلای شاکیان در نامهای به دادگاه نوشتند که این اتفاق باعث شده است تا آنها مجبور شوند کار خود را از ابتدا آغاز کنند، که این امر نیازمند صرف ساعتهای کاری بیشتر و هزینههای پردازشی سنگین است.
ادعای عمدی نبودن حذف دادهها
هرچند وکلای نیویورک تایمز و دیلی نیوز اعلام کردند که هیچ دلیلی برای اعتقاد به عمدی بودن این حذف وجود ندارد، اما آنها تأکید کردند که این حادثه نشان میدهد OpenAI بهتر است خود به جستجوی دادههای آموزشیاش برای محتوای نقضکننده بپردازد.
از سوی دیگر، OpenAI به این اتهامات پاسخ داد و در نامهای رسمی اعلام کرد که حذف دادهها ناشی از تغییر در پیکربندی سیستم بوده است؛ تغییری که به درخواست شاکیان اعمال شده بود.
دفاع OpenAI از خود
در پاسخ به نامه وکلای شاکیان، وکلای OpenAI تأکید کردند که هیچ شواهدی از بین نرفته است. آنها توضیح دادند که شاکیان خواستار تغییراتی در تنظیمات یکی از ماشینها بودند و اجرای این تغییرات باعث حذف ساختار پوشهها و برخی از نام فایلها در یکی از حافظههای موقت شد.
به گفته OpenAI، این حافظه قرار بود تنها بهعنوان فضای موقتی مورد استفاده قرار گیرد و دادههای اصلی تحت تأثیر قرار نگرفتهاند.
همچنین می توانید قابلیتهای جدید Gemini ... را مطالعه کنید
استفاده منصفانه یا نقض حقتکثیر؟
این پرونده به بحثی اساسیتر در مورد حقوق مالکیت معنوی دامن زده است. OpenAI همواره اصرار داشته که استفاده از دادههای عمومی برای آموزش مدلهای هوش مصنوعی، تحت قوانین "استفاده منصفانه" قرار میگیرد. به گفته این شرکت، مدلهایی مانند GPT-4 از دادههای عمومی نظیر مقالات و کتابها برای یادگیری استفاده میکنند و این روند نیازی به دریافت مجوز ندارد، حتی اگر از این مدلها کسب درآمد شود.
با این حال، OpenAI بهطور همزمان با برخی ناشران قراردادهایی برای استفاده از محتوای آنها امضا کرده است. این شرکت، از جمله با خبرگزاری آسوشیتدپرس و شرکتهایی مانند Axel Springer و News Corp همکاری دارد.
نتیجهگیری
این پرونده نشان میدهد که چالشهای حقوقی مرتبط با هوش مصنوعی و استفاده از محتوای دارای حقتکثیر همچنان ادامه دارند. حذف تصادفی دادهها توسط OpenAI، فارغ از عمدی یا غیرعمدی بودن، اهمیت بررسی دقیقتر حقوق مالکیت معنوی را برجسته میکند. نتیجه این پرونده میتواند تأثیرات گستردهای بر آینده تعاملات بین شرکتهای فناوری و ناشران محتوا داشته باشد.
این حادثه به ما یادآوری میکند که در عصر هوش مصنوعی، شفافیت و رعایت حقوق مالکیت معنوی، کلید اعتماد و موفقیت در بلندمدت خواهد بود.
برای اطلاعات بیشتر به TechCrunch مراجعه بفرمایید