جوجل يعمل خارجا ، رائعة مخيفة قليلا طريقة لمنظمة العفو الدولية لعزل الأصوات في حشد من الناس

يتم تضخيم صوت واحد ، والآخر صامت تكبير / واحد يتم تضخيم الصوت ، والآخر صامت

طور باحثو Google نظامًا للتعلم العميق مصمم لمساعدة أجهزة الكمبيوتر على تحديد الأفراد وعزلهم بشكل أفضل الأصوات داخل بيئة صاخبة.

كما هو مذكور في منشور على مدونة Google Research للشركة ، الأسبوع ، حاول فريق ضمن عملاق التكنولوجيا لتكرار تأثير حفلة الكوكتيل ، أو قدرة الدماغ البشري على التركيز على واحد مصدر الصوت أثناء تصفية الآخرين — تمامًا كما تفعل التحدث مع صديق في حفلة.

تستخدم طريقة Google نموذجًا صوتيًا ومرئيًا ، لذلك فهو في المقام الأول ركز على عزل الأصوات في مقاطع الفيديو. نشرت الشركة عددا لمقاطع فيديو يوتيوب التي تبين التكنولوجيا في العمل

تبحث للاستماع: Stand-up Looking to Listen: Sportsالنقاش

تقول الشركة إن هذه التقنية تعمل على مقاطع الفيديو بصوت واحد تتبع ويمكن عزل الأصوات في فيديو خوارزمية ، اعتمادا حول من يتحدث أو عن طريق تحديد مستخدم يدويًا لوجه الشخص الذي يريد أن يسمع صوته.

تقول Google إن العنصر المرئي هنا هو المفتاح ، حيث أن التكنولوجيا يراقب عندما يتحرك فم الشخص لتحديد هويته بشكل أفضل التي الأصوات للتركيز عليها في نقطة معينة وخلق المزيد مسارات الكلام الفردية دقيقة لطول الفيديو.

وفقا لنشر بلوق ، طور الباحثون هذا النموذج من خلال جمع 100،000 فيديو من “المحاضرات والمحادثات” على يوتيوب ، استخراج ما يقرب من 2000 ساعة من الأجزاء من مقاطع الفيديو هذه يضم خطاب بلا عائق ، ثم خلط هذا الصوت لإنشاء “حفل كوكتيل اصطناعي” مع ضوضاء خلفية اصطناعية وأضاف.

ثم قامت Google بتدريب التقنية على تقسيم هذا الصوت المختلط بواسطة قراءة “الصور المصغرة للوجه” للأشخاص الذين يتحدثون في كل مقطع فيديو إطار وطيفية للموسيقى التصويرية لهذا الفيديو. النظام هو قادرة على فرز مصدر الصوت الذي ينتمي إلى أي وجه في وقت معين وخلق مسارات خطاب منفصلة لكل متحدث. يا للعجب.

تتطلع إلى الاستماع: فيديو conferencing Looking to Listen: Noisyكافيتيريا

حددت Google أنظمة التسميات التوضيحية المغلقة كمجال واحد هذا النظام يمكن أن يكون بمثابة نعمة ، لكن الشركة تقول إنها تتصور “أ مجموعة واسعة من التطبيقات لهذه التكنولوجيا “وأنه هو “حاليا استكشاف الفرص لإدراجه في العديد من منتجات Google. “يبدو أن Hangouts و YouTube هما سهلان أماكن للبدء. ليس من الصعب أن نرى كيف يمكن للتكنولوجيا أن تعمل عندما تنطبق على زوج من النظارات الذكية ، مثل Google Glass و سماعات الأذن تضخيم الصوت ، إما.

قراءة متعمقة

Pixel Buds review: OK Google ، ارجع إلى رسم earbud board مساعدة السماعات الذكية مثل Google Home في قدرتها على التعرف على الأصوات الفردية يبدو وكأنه حالة استخدام أخرى ، ولكن نظرًا لأن هذا النموذج يركز على الفيديو ، فمن المحتمل أن يعمل بشكل أفضل مع مكبر صوت مع شاشة ، مثل عرض Echo من Amazon. سابقا هذا العام ، فتحت جوجل مساعد جوجل ل “العرض الذكي” مثل أجهزة Echo Show ، إلا أن الشركة لم تصدر واحد نفسه.

في أي حال ، يبدو أن تداعيات الخصوصية لهذا النوع من التكنولوجيا تماما كما هو واضح حالات الاستخدام المحتملة. صوت جوجل العزلة أبعد ما تكون عن الرصاص في الأمثلة أعلاه ، ولكن مع بعض أكثر صقل ، يمكن أن تجعل لالتنصت قوية وأداة المراقبة في الأيدي الخطأ.

هذا الكثير من التكهنات في الوقت الحالي. هنا يأمل هذا البحث على الأقل يقلل من الحاجة إلى الصراخ في جوجل هوم في مستقبل.

Like this post? Please share to your friends:
Leave a Reply

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: