“مايكروسوفت” تطور نظاماً ذكياً يُقلد أصوات البشر بدقة

طوَّرت شركة “مايكروسوفت” نظاماً ذكياً لديه القدرة على إنشاء مقاطع بصوت أي إنسان، وذلك من خلال تدريب النظام على مقطع بصوت الشخص المستهدف، لا تزيد مدته عن 3 ثوانٍ فقط.
ويحمل نظام “مايكروسوفت” الجديد اسم “VALL-E” ويعمل على تحويل النصوص المكتوبة إلى مقاطع صوتية، وذلك بحسب صفحة المصدر الكودي للنظام على موقع GitHub.
نظام “مايكروسوفت” الجديد
لا يقتصر النظام على إنشاء مقاطع صوتية عبر كتابة نصوص عشوائية، لكنه يستطيع أيضاً مراعاة أسلوب القراءة ونبرة الصوت، لإظهار شخصية صاحب الصوت الأصلي في المقاطع الصوتية المزيفة.
وبحسب الموقع، لا يزال النظام قيد التطوير والبحث، لكن المشروع يقدم مستوىً فائقاً في دقة محاكاة العوامل والمؤثرات الصوتية المحيطة بالمتحدث في المقطع الأصلي البالغة مدته 3 ثوان فقط، بحيث يتم إبرازها في المقاطع المصنعة بشكل أقرب للحقيقة.
وأوضحت عينات مقاطع صوتية عرضتها “مايكروسوفت” للكشف عن قدرات نظامها الجديد، مستوى دقيق للبرنامج في إنشاء مقاطع صوتية كأنها مسجلة خلال مكالمة هاتفية، وذلك من خلال اقتباس نمط الصوت ومستواه ودرجة شدته، من المقطع الأصلي المُسجل للمستخدم خلال حديثه في الحقيقة.
وأثبتت “مايكروسوفت” من خلال المقاطع الصوتية التي نشرتها على صفحة النظام الجديد على “جت هب” أن النظام بإمكانه إنشاء مقاطع صوتية بأساليب مختلفة، عبر استخدام صوت شخص واحد.
“تزييف عميق” للأصوات يخدع البشر والأجهزة الذكية!
وفقاً لتقرير جديد، يمكن لبرامج تقنية Deep Fake، التي أصبحت متوفرة بسهولة، تقليد صوت شخص ما بدرجة من الدقة يمكن أن تخدع كلا من البشر والأجهزة الذكية.
وفقًا لما نشرته “ديلي ميل” البريطانية، قام الباحثون في مختبر الأمن والخوارزميات والشبكات والبيانات SAND بجامعة شيكاغو باختبار برامج التوليف الصوتي العميق المتاحة على موقع مجتمع المطورين مفتوح المصدر Github لمعرفة ما إذا كان بإمكانهم تخطي برامج الحماية التي تعتمد على نظام أمان بخاصية التعرف على الصوت في تطبيقات Amazon’s Alexa وWeChat وMicrosoft Azure.
كما أوضح الباحثون أن المقاطع الصوتية، التي تم تقليدها باستخدام تقنية “ديب فيك”، استطاعت خداع آذان البشر، إذ لم يستطع 200 متطوع من التمييز بين الأصوات الحقيقية وبين ما تم تزييفه ببرامج “ديب فيك” بنسبة 50%، مع ملاحظة أن التزييف العميق كان أكثر نجاحًا في تقليد أصوات النساء وأصوات ناطقي اللغة الإنكليزية من أصحاب الأصول الأجنبية.