صناعة وسم البيانات بواسطة الذكاء الاصطناعي تشهد تحولًا كبيرًا
مؤخراً، شهدت صناعة التكنولوجيا موجة من الاهتمام بتوسيم البيانات. من جهة، قامت إحدى عمالقة وسائل التواصل الاجتماعي باستثمار 14.8 مليار دولار للاستحواذ على نحو نصف حصص شركة متخصصة في توسيع البيانات، مما أدى إلى إعادة تقييم قيمة توسيع البيانات في القطاع. من جهة أخرى، مشروع ناشئ في Web3 AI على وشك إصدار رموز، محاولاً إعادة تشكيل صناعة توسيع البيانات بطريقة لامركزية. وراء هذا التباين الواضح، يبدو أن السوق تتجاهل بعض العوامل الرئيسية.
تتمتع تسمية البيانات بفرص نمو أكبر مقارنة بتجميع القوة الحاسوبية الموزعة. على الرغم من أن قصة استخدام وحدات معالجة الرسوميات غير المستغلة للتحدي ضد عمالقة الحوسبة السحابية مثيرة للاهتمام، إلا أن القوة الحاسوبية في جوهرها تعتبر سلعة موحدة، والاختلاف الرئيسي يكمن في السعر والتوافر. بالمقابل، تعتبر تسمية البيانات مجالاً يحتاج إلى الحكمة البشرية والحكم المهني. كل علامة جودة عالية تحتوي على معرفة متخصصة فريدة، وخلفية ثقافية، وتجارب إدراكية، ولا يمكن تكرارها ببساطة مثل قوة GPU.
على سبيل المثال، يتطلب وضع علامات دقيقة على تشخيصات تصوير السرطان حدسًا مهنيًا من أطباء الأورام المتمرسين، في حين أن تحليل المشاعر في الأسواق المالية يتطلب خبرة عملية من متداولي وول ستريت. هذه الندرة الطبيعية وعدم القابلية للاستبدال تعطي وضع العلامات على البيانات ميزة تنافسية تفوق القدرة الحاسوبية.
في 10 يونيو، أعلن عملاق وسائل التواصل الاجتماعي عن استحواذه على 49% من أسهم شركة لتوسيع البيانات مقابل 14.8 مليار دولار، محققاً أكبر استثمار في مجال الذكاء الاصطناعي هذا العام. تأسست الشركة في عام 2016، وبلغت قيمتها الحالية 30 مليار دولار، حيث تشمل عملائها العديد من الشركات المعروفة في مجال الذكاء الاصطناعي، وصانعي السيارات، وعملاقة التكنولوجيا، والدوائر الحكومية.
كشفت هذه الصفقة عن حقيقة تم تجاهلها: في زمن لم يعد فيه قوة الحوسبة نادرة، وأصبح هيكل النموذج متجانسًا، فإن ما يحدد حقًا الحد الأقصى للذكاء الاصطناعي هو تلك البيانات التي تم معالجتها بعناية. إن عملاق وسائل التواصل الاجتماعي لم يشترِ فقط شركة متخصصة في الخدمات الخارجية بأسعار مرتفعة، بل اشترى أيضًا "حق استخراج النفط" في عصر الذكاء الاصطناعي.
ومع ذلك، فإن الاحتكار دائمًا ما يؤدي إلى التمرد. تمامًا كما تحاول منصات الحوسبة الموزعة قلب خدمات الحوسبة السحابية المركزية، فإن مشاريع Web3 AI الناشئة تحاول إعادة تشكيل قواعد توزيع قيمة تصنيف البيانات باستخدام تقنية blockchain. تكمن المشكلة الرئيسية في نموذج تصنيف البيانات التقليدي في تصميم آلية التحفيز غير المعقولة.
على سبيل المثال، قد يقضي طبيب ساعات في وضع علامات على صور طبية، ومع ذلك يحصل فقط على أجر ضئيل، في حين أن قيمة نموذج الذكاء الاصطناعي المدرب على هذه البيانات قد تصل إلى عدة مليارات من الدولارات، لكن الطبيب لا يمكنه مشاركة أي من العائدات. هذه التوزيعة غير العادلة للقيمة تؤثر بشكل كبير على حافز توفير البيانات عالية الجودة.
توقع أن تؤدي آلية تحفيز الرموز في تقنيات Web3 إلى تغيير هذا الوضع. في النموذج الجديد، لم يعد موصّف البيانات "عمال بيانات" رخيصين، بل أصبحوا "مساهمين" حقيقيين في شبكة نماذج اللغة الذكية. من الواضح أن مزايا Web3 في تحويل علاقات الإنتاج يمكن أن تتجلى بشكل أكبر في مجال توصيف البيانات.
من الجدير بالذكر أن هذا المشروع الخاص بـ Web3 AI أطلق الرموز في نفس الوقت الذي أعلنت فيه عملاق وسائل التواصل الاجتماعي عن الاستحواذ، وقد لا يكون هذا مصادفة. تعكس هذه الظاهرة نقطة تحول في السوق: سواء كان ذلك في Web3 AI أو AI التقليدي، فقد انتقلنا من "تنافس القدرة الحاسوبية" إلى "تنافس جودة البيانات" في مرحلة جديدة.
عندما تتخذ الشركات التقليدية من رأس المال وسيلة لبناء حواجز البيانات، فإن Web3 يفتح تجربة أوسع من "ديمقراطية البيانات" من خلال اقتصاد الرموز. لقد بدأت بالفعل حرب خفية حول من سيملك مستقبل الذكاء الاصطناعي، وستؤثر التغييرات في صناعة وضع البيانات بشكل عميق على النظام البيئي بأكمله للذكاء الاصطناعي.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
148 مليار دولار الاستحواذ引爆数据标注热潮 Web3项目或改变行业格局
صناعة وسم البيانات بواسطة الذكاء الاصطناعي تشهد تحولًا كبيرًا
مؤخراً، شهدت صناعة التكنولوجيا موجة من الاهتمام بتوسيم البيانات. من جهة، قامت إحدى عمالقة وسائل التواصل الاجتماعي باستثمار 14.8 مليار دولار للاستحواذ على نحو نصف حصص شركة متخصصة في توسيع البيانات، مما أدى إلى إعادة تقييم قيمة توسيع البيانات في القطاع. من جهة أخرى، مشروع ناشئ في Web3 AI على وشك إصدار رموز، محاولاً إعادة تشكيل صناعة توسيع البيانات بطريقة لامركزية. وراء هذا التباين الواضح، يبدو أن السوق تتجاهل بعض العوامل الرئيسية.
تتمتع تسمية البيانات بفرص نمو أكبر مقارنة بتجميع القوة الحاسوبية الموزعة. على الرغم من أن قصة استخدام وحدات معالجة الرسوميات غير المستغلة للتحدي ضد عمالقة الحوسبة السحابية مثيرة للاهتمام، إلا أن القوة الحاسوبية في جوهرها تعتبر سلعة موحدة، والاختلاف الرئيسي يكمن في السعر والتوافر. بالمقابل، تعتبر تسمية البيانات مجالاً يحتاج إلى الحكمة البشرية والحكم المهني. كل علامة جودة عالية تحتوي على معرفة متخصصة فريدة، وخلفية ثقافية، وتجارب إدراكية، ولا يمكن تكرارها ببساطة مثل قوة GPU.
على سبيل المثال، يتطلب وضع علامات دقيقة على تشخيصات تصوير السرطان حدسًا مهنيًا من أطباء الأورام المتمرسين، في حين أن تحليل المشاعر في الأسواق المالية يتطلب خبرة عملية من متداولي وول ستريت. هذه الندرة الطبيعية وعدم القابلية للاستبدال تعطي وضع العلامات على البيانات ميزة تنافسية تفوق القدرة الحاسوبية.
في 10 يونيو، أعلن عملاق وسائل التواصل الاجتماعي عن استحواذه على 49% من أسهم شركة لتوسيع البيانات مقابل 14.8 مليار دولار، محققاً أكبر استثمار في مجال الذكاء الاصطناعي هذا العام. تأسست الشركة في عام 2016، وبلغت قيمتها الحالية 30 مليار دولار، حيث تشمل عملائها العديد من الشركات المعروفة في مجال الذكاء الاصطناعي، وصانعي السيارات، وعملاقة التكنولوجيا، والدوائر الحكومية.
كشفت هذه الصفقة عن حقيقة تم تجاهلها: في زمن لم يعد فيه قوة الحوسبة نادرة، وأصبح هيكل النموذج متجانسًا، فإن ما يحدد حقًا الحد الأقصى للذكاء الاصطناعي هو تلك البيانات التي تم معالجتها بعناية. إن عملاق وسائل التواصل الاجتماعي لم يشترِ فقط شركة متخصصة في الخدمات الخارجية بأسعار مرتفعة، بل اشترى أيضًا "حق استخراج النفط" في عصر الذكاء الاصطناعي.
ومع ذلك، فإن الاحتكار دائمًا ما يؤدي إلى التمرد. تمامًا كما تحاول منصات الحوسبة الموزعة قلب خدمات الحوسبة السحابية المركزية، فإن مشاريع Web3 AI الناشئة تحاول إعادة تشكيل قواعد توزيع قيمة تصنيف البيانات باستخدام تقنية blockchain. تكمن المشكلة الرئيسية في نموذج تصنيف البيانات التقليدي في تصميم آلية التحفيز غير المعقولة.
على سبيل المثال، قد يقضي طبيب ساعات في وضع علامات على صور طبية، ومع ذلك يحصل فقط على أجر ضئيل، في حين أن قيمة نموذج الذكاء الاصطناعي المدرب على هذه البيانات قد تصل إلى عدة مليارات من الدولارات، لكن الطبيب لا يمكنه مشاركة أي من العائدات. هذه التوزيعة غير العادلة للقيمة تؤثر بشكل كبير على حافز توفير البيانات عالية الجودة.
توقع أن تؤدي آلية تحفيز الرموز في تقنيات Web3 إلى تغيير هذا الوضع. في النموذج الجديد، لم يعد موصّف البيانات "عمال بيانات" رخيصين، بل أصبحوا "مساهمين" حقيقيين في شبكة نماذج اللغة الذكية. من الواضح أن مزايا Web3 في تحويل علاقات الإنتاج يمكن أن تتجلى بشكل أكبر في مجال توصيف البيانات.
من الجدير بالذكر أن هذا المشروع الخاص بـ Web3 AI أطلق الرموز في نفس الوقت الذي أعلنت فيه عملاق وسائل التواصل الاجتماعي عن الاستحواذ، وقد لا يكون هذا مصادفة. تعكس هذه الظاهرة نقطة تحول في السوق: سواء كان ذلك في Web3 AI أو AI التقليدي، فقد انتقلنا من "تنافس القدرة الحاسوبية" إلى "تنافس جودة البيانات" في مرحلة جديدة.
عندما تتخذ الشركات التقليدية من رأس المال وسيلة لبناء حواجز البيانات، فإن Web3 يفتح تجربة أوسع من "ديمقراطية البيانات" من خلال اقتصاد الرموز. لقد بدأت بالفعل حرب خفية حول من سيملك مستقبل الذكاء الاصطناعي، وستؤثر التغييرات في صناعة وضع البيانات بشكل عميق على النظام البيئي بأكمله للذكاء الاصطناعي.