گروه مهندسی سحاب - حذف تصادفی داده‌ها توسط OpenAI؛ ماجرای پرونده حق‌تکثیر نیویورک تایمز

OpenAI متهم به نقض حق‌تکثیر نیویورک تایمز شد؛ حذف تصادفی داده‌ها ماجرای جنجالی پرونده را پیچیده‌تر کرد. آیا شواهد از بین رفته‌اند؟

در دنیای تکنولوژی و هوش مصنوعی، موضوعات مربوط به حقوق مالکیت معنوی و استفاده از محتوای دارای حق‌تکثیر همواره محل بحث و چالش بوده‌اند. طبق بررسی های کارشناسان شرکت سحاب اخیراً شکایتی از سوی نیویورک تایمز و دیلی نیوز علیه OpenAI مطرح شده که به اتهام استفاده بدون اجازه از محتوای این ناشران برای آموزش مدل‌های هوش مصنوعی اشاره دارد. در این میان، اتفاقی بحث‌برانگیز رخ داده که توجه بسیاری را به خود جلب کرده است.

حذف تصادفی داده‌ها توسط OpenAI

در پاییز امسال، OpenAI برای شفاف‌سازی و همکاری با نیویورک تایمز و دیلی نیوز، موافقت کرد که دو ماشین مجازی در اختیار وکلای این ناشران قرار دهد. این ماشین‌ها به وکلای شاکی اجازه می‌داد تا محتوای خود را در میان داده‌های آموزشی OpenAI جستجو کنند.
(ماشین‌های مجازی، کامپیوترهای نرم‌افزاری هستند که درون سیستم‌عامل یک کامپیوتر دیگر اجرا می‌شوند و اغلب برای آزمایش، پشتیبان‌گیری و اجرای برنامه‌ها استفاده می‌شوند.)

وکلای ناشران اعلام کردند که آنها و کارشناسان استخدامی‌شان از اول نوامبر بیش از ۱۵۰ ساعت را صرف بررسی داده‌های آموزشی کرده‌اند. اما در تاریخ ۱۴ نوامبر، OpenAI اعلام کرد که داده‌های ذخیره‌شده در یکی از ماشین‌های مجازی به‌طور تصادفی توسط مهندسان این شرکت حذف شده است.برای ادامه مطلب با ما در شرکت سحاب همراه شوید.

آیا بازیابی داده‌ها موفق بود؟

OpenAI پس از این اتفاق تلاش کرد داده‌های حذف‌شده را بازیابی کند و در این کار تا حد زیادی موفق شد. اما مشکلی جدی باقی ماند: ساختار پوشه‌ها و نام فایل‌ها به‌طور غیرقابل‌بازگشتی از بین رفته بود. این موضوع باعث شد که داده‌های بازیابی‌شده عملاً غیرقابل‌استفاده شوند، زیرا نمی‌توانستند مشخص کنند کدام مقالات دارای حق‌تکثیر برای آموزش مدل‌ها استفاده شده‌اند.

وکلای شاکیان در نامه‌ای به دادگاه نوشتند که این اتفاق باعث شده است تا آنها مجبور شوند کار خود را از ابتدا آغاز کنند، که این امر نیازمند صرف ساعت‌های کاری بیشتر و هزینه‌های پردازشی سنگین است.

ادعای عمدی نبودن حذف داده‌ها

هرچند وکلای نیویورک تایمز و دیلی نیوز اعلام کردند که هیچ دلیلی برای اعتقاد به عمدی بودن این حذف وجود ندارد، اما آنها تأکید کردند که این حادثه نشان می‌دهد OpenAI بهتر است خود به جستجوی داده‌های آموزشی‌اش برای محتوای نقض‌کننده بپردازد.

از سوی دیگر، OpenAI به این اتهامات پاسخ داد و در نامه‌ای رسمی اعلام کرد که حذف داده‌ها ناشی از تغییر در پیکربندی سیستم بوده است؛ تغییری که به درخواست شاکیان اعمال شده بود.

دفاع OpenAI از خود

در پاسخ به نامه وکلای شاکیان، وکلای OpenAI تأکید کردند که هیچ شواهدی از بین نرفته است. آنها توضیح دادند که شاکیان خواستار تغییراتی در تنظیمات یکی از ماشین‌ها بودند و اجرای این تغییرات باعث حذف ساختار پوشه‌ها و برخی از نام فایل‌ها در یکی از حافظه‌های موقت شد.

به گفته OpenAI، این حافظه قرار بود تنها به‌عنوان فضای موقتی مورد استفاده قرار گیرد و داده‌های اصلی تحت تأثیر قرار نگرفته‌اند.

همچنین می توانید قابلیت‌های جدید Gemini ... را مطالعه کنید

استفاده منصفانه یا نقض حق‌تکثیر؟

این پرونده به بحثی اساسی‌تر در مورد حقوق مالکیت معنوی دامن زده است. OpenAI همواره اصرار داشته که استفاده از داده‌های عمومی برای آموزش مدل‌های هوش مصنوعی، تحت قوانین "استفاده منصفانه" قرار می‌گیرد. به گفته این شرکت، مدل‌هایی مانند GPT-4 از داده‌های عمومی نظیر مقالات و کتاب‌ها برای یادگیری استفاده می‌کنند و این روند نیازی به دریافت مجوز ندارد، حتی اگر از این مدل‌ها کسب درآمد شود.

با این حال، OpenAI به‌طور هم‌زمان با برخی ناشران قراردادهایی برای استفاده از محتوای آنها امضا کرده است. این شرکت، از جمله با خبرگزاری آسوشیتدپرس و شرکت‌هایی مانند Axel Springer و News Corp همکاری دارد.

نتیجه‌گیری

این پرونده نشان می‌دهد که چالش‌های حقوقی مرتبط با هوش مصنوعی و استفاده از محتوای دارای حق‌تکثیر همچنان ادامه دارند. حذف تصادفی داده‌ها توسط OpenAI، فارغ از عمدی یا غیرعمدی بودن، اهمیت بررسی دقیق‌تر حقوق مالکیت معنوی را برجسته می‌کند. نتیجه این پرونده می‌تواند تأثیرات گسترده‌ای بر آینده تعاملات بین شرکت‌های فناوری و ناشران محتوا داشته باشد.

این حادثه به ما یادآوری می‌کند که در عصر هوش مصنوعی، شفافیت و رعایت حقوق مالکیت معنوی، کلید اعتماد و موفقیت در بلندمدت خواهد بود.

برای اطلاعات بیشتر به TechCrunch مراجعه بفرمایید

مشاهده همه مقالات

کارشناس سحاب: محمد حسین حبیبی

حذف تصادفی داده‌ها توسط OpenAI؛ ماجرای پرونده حق‌تکثیر نیویورک تایمز

حذف تصادفی داده‌ها توسط OpenAI

آیا بازیابی داده‌ها موفق بود؟

ادعای عمدی نبودن حذف داده‌ها

دفاع OpenAI از خود

استفاده منصفانه یا نقض حق‌تکثیر؟

نتیجه‌گیری

OpenAI امنیت را در برابر جاسوسی و رقابت تقویت می‌کند

همکاری OpenAI و Jony Ive طراح طراحان، برای توسعه دستگاه هوش مصنوعی جدید

رونمایی ASUS از راهکارهای زیرساختی هوش مصنوعی در CloudFest 2025

رونمایی گوگل از پلتفرم هوش مصنوعی Gemini 2.5 Pro در Google I/O 2025

مشاهده همه مقالات

کارشناس سحاب: محمد حسین حبیبی

حذف تصادفی داده‌ها توسط OpenAI؛ ماجرای پرونده حق‌تکثیر نیویورک تایمز

حذف تصادفی داده‌ها توسط OpenAI

آیا بازیابی داده‌ها موفق بود؟

ادعای عمدی نبودن حذف داده‌ها

دفاع OpenAI از خود

استفاده منصفانه یا نقض حق‌تکثیر؟

نتیجه‌گیری

مطالب مرتبط

OpenAI امنیت را در برابر جاسوسی و رقابت تقویت می‌کند

همکاری OpenAI و Jony Ive طراح طراحان، برای توسعه دستگاه هوش مصنوعی جدید

رونمایی ASUS از راهکارهای زیرساختی هوش مصنوعی در CloudFest 2025

رونمایی گوگل از پلتفرم هوش مصنوعی Gemini 2.5 Pro در Google I/O 2025