أظهر الباحثون اليكسا “القرفصاء المهارة” يمكن اختطاف الأوامر الصوتية

يظهر الباحثون أنتكبير Amazon

نجاح أجهزة Internet of Things مثل Amazon’s Echo وخلقت Google Home فرصة للمطورين للبناء التطبيقات التي يتم تنشيطها للصوت والتي تتصل أعمق من أي وقت مضى منازل العملاء والحياة الشخصية. و- وفقًا للبحث الذي أجراه أ فريق من جامعة إلينوي في أوربانا شامبين (UIUC) – القدرة على استغلال بعض من خصوصيات نظم التعلم الآلي التعرف على الصوت لأغراض ضارة نمت كذلك.

تسمى “مهارة القرفصاء” طريقة الهجوم (الموصوفة في ورقة قدمت في الندوة الأمنية USENIX في بالتيمور هذا الشهر) يقتصر حاليًا على نظام Amazon Alexa ، لكنه يكشف عن نقاط ضعف يجب أن تحلها الأنظمة الصوتية الأخرى لأنها توسع الدعم لتطبيقات الطرف الثالث. التقى آرس فريق UIUC (الذي يتكون من ديباك كومار ، ريكاردو باكانييلا ، بول مورلي ، إريك هيننفنت ، جوشوا ماسون ، مساعد البروفيسور آدم بيتس ، والبروفيسور مايكل بيلي) بجامعة USENIX الأمان. تحدثنا عن أبحاثهم واحتمالات التهديدات الأخرى الناجمة عن الإدخال الصوتي للمعلومات الأنظمة.

صوت سيدها

كان هناك عدد من المظاهرات الأخيرة للهجمات أن النفوذ واجهات الصوت. في مارس ، أظهر الباحثون أن ، حتى عندما يكون Windows 10 مغلقًا ، يستجيب “مساعد” Cortana الأوامر الصوتية – بما في ذلك فتح المواقع. و لقد أثبتت أجهزة إنترنت الأشياء التي تدعم التعرف على الصوت أنها كذلك عرضة للأوامر من الراديو أو الإعلانات التلفزيونية ، يوتيوب أشرطة الفيديو ، والأطفال الصغار.

تتجاوز مشكلة عدم الحصانة هذه الأوامر الصوتية المسموعة فقط. في ورقة منفصلة قدمت في USENIX Security هذا الشهر ، بواسطة يوان شيويه جينغ من مختبر الدولة الرئيسي لأمن المعلومات في الصين ، أثبت الباحثون أن الصوت جزءا لا يتجزأ من الموسيقى التصويرية الفيديو ، يمكن تعديل دفق الموسيقى أو البث الإذاعي لتحريك الصوت أوامر في أنظمة التعرف على الكلام التلقائي دون أن الكشف عنها من قبل المستمع البشري. معظم المستمعين لم يتمكنوا من تحديد مشاكل مع الأغاني المعدلة.

لكن هجمات القرفصاء للمهارات قد تشكل خطرًا أكثر إلحاحًا يبدو ، وجد الباحثون ، أن المطورين تعطي بالفعل أسماء التطبيقات الخاصة بهم التي تشبه تلك الشائعة التطبيقات. بعض هذه – مثل “حقائق الأسماك” (مهارة ذلك إرجاع حقائق عشوائية عن الأسماك والفقاريات المائية) “حقائق مخادعة” (مهارة تُرجع حقائق عن فيرمونت) المربى الفرقة) – عرضي ، ولكن البعض الآخر مثل “كات فاكس” (والتي يحاكي “حقائق القط”) بشكل مقصود.

An example of a potential "sound-alike" error using Alexa, where طلبات خطف اسم مشابه السبر طلبات مهارة أخرى  (and produces a questionable fact).تكبير / مثال لخطأ محتمل “يشبه الصوت” باستخدام Alexa ، حيث a similar-sounding skill name hijacks requests for another skill(وتنتج حقيقة مشكوك فيها). كومار وآخرون ، UIUC

بفضل الطريقة التي تعامل بها Alexa مع طلبات “المهارات” الجديدة – التطبيقات السحابية التي تسجل مع Amazon – من الممكن إنشاء مهارات ضارة تتم تسميتها باستخدام المتجانسات الموجودة التطبيقات المشروعة. جعلت الأمازون جميع المهارات في مكتبتها متوفرة بواسطة الأوامر الصوتية بشكل افتراضي في عام 2017 ، ويمكن أن تكون المهارات “تثبيت” في مكتبة العميل عن طريق الصوت. “اما الطريقة، هناك هجوم صوتي فقط للأشخاص الذين هم انتقائي وقال بيتس ، الذي يقود شركة UIUC الآمنة و مختبر النظم الشفافة.

هذا النوع من الأشياء يوفر كل أنواع الإمكانات الضارة المطورين. يمكنهم بناء المهارات التي تعترض طلباتهم المهارات المشروعة من أجل دفع تفاعلات المستخدم التي تسرق المعلومات الشخصية والمالية. هذه سوف تستخدم أساسا اليكسا لتسليم هجمات التصيد (نوع الاحتيال الإجرامي ، وليس نوع المربى الفرقة). أظهر الباحثون UIUC (في رمل البيئة) كيف يمكن استخدام مهارة تسمى “Am Express” اختطف الطلبات الأولية لمهارة أميكس أمريكان إكسبريس وسرقة بيانات اعتماد المستخدمين.

مظاهرة لكيفية يمكن استخدام مهارة معادية لسرقة أوراق الاعتماد.

هل سمعت هذا الحق؟

هناك أيضا كلمات أن اليكسا الأخطاء الشائعة للآخرين الكلمات ، ربما بسبب لهجة أصوات اليكسا تم تدريب مصنفات التعلم الآلي. لتحديد بعض هذه ، استفاد فريق UIUC من مجموعة من عينات الصوت من مشروع خطاب على الصعيد الوطني. (هذه المجموعة من عينات الكلام من 60 متحدثًا مختلفًا من مناطق اللهجات الست الرئيسية في الولايات المتحدة تم جمعها من قبل الباحثين اللغويات سينثيا كلوبر (الآن في جامعة أوهايو) وديفيد بيسوني.)

Predictable, exploitable errors found in Alexa voice processing.Enlarge/ يمكن التنبؤ بها ، والأخطاء التي يمكن استغلالها وجدت في صوت اليكسا معالجة. كومار وآخرون ، UIUC

تتكون المجموعة المستخدمة من قبل فريق UIUC من 188 فريدة من نوعها الكلمات التي يتحدث بها كل من المتحدثين الستين — ما مجموعه 11،460 صوتًا العينات. تم دفع هذه العينات إلى مهارة Alexa التي بناها فريق يسمى “سجل هذا”. مهارة نسخ الكلمات إلى نص باستخدام تطبيق عميل قام بتشغيل الصوت على دفعات و تسيطر على معدل الطلبات حتى لا تقصف اليكسا خادم معالجة الصوت. “أرسلنا كل عينة خطاب إلى اليكسا 50 وقال كومار “مرات ، توفر لنا 573،000 النسخ عبر 60 متحدثا. ”

من بين 188 كلمة ، حدد الاختبار 27 (14 بالمائة) سوف أسيء تفسيرها من قبل اليكسا بكلمة أخرى. بالإضافة إلى ذلك ، وجد البحث كلمات معينة ألكسا يساء تفسيرها باللهجات والأجناس – بمعنى ذلك هذه الكلمات يمكن أن تستخدم على الأرجح لاستهداف الهجمات ضد ديموغرافية محددة.

شارك فريق UIUC النتائج التي توصل إليها مع فريق الأمان في Amazon. اتصل آرس بالأمازون ليرى ما تم القيام به لصد هذه الأمور أنواع الهجمات ، وتلقينا البيان الرسمي التالي في رد من متحدث باسم أمازون: “ثقة العملاء مهمة بالنسبة لنا ، ونجري مراجعات أمنية كجزء من المهارة عملية إصدار الشهادات. لدينا التخفيفات في مكان للكشف عن هذا نوع من سلوك المهارة ورفض أو إزالتها عندما حددت “.

واعترف الباحثون UIUC كان هناك قيود على مدى يمكن أن تأخذ الاختبارات الخاصة بهم دون نشر مهارة في الواقع في مكتبة إنتاج اليكسا. لكن البروفيسور بيتس قال إنه على الأرجح أن حل المشكلة بأوامر misheard “ليس بالأمر” نضغط على التصحيح والمشكلة تختفي – إنها المشكلة وضع ثقتنا في معالجة اللغة للتعلم الآلي المصنف ، وجميع المصنفات التعلم آلة سوف تجعل أخطاء. لذلك ، تبديل لوحة المفاتيح – جهاز تمثيلي نحن الثقة – مع التعلم الآلي ، ستكون هناك مشاكل ، و انهم سوف يطفو على السطح في أماكن أكثر من حارة المهارات. ”

يبحث فريق UIUC في عدد من الخطوات التالية المحتملة البحث ، بما في ذلك كيف يمكن أليسا مشكلة معالجة الصوت تأثير التركيبة السكانية المختلفة بشكل مختلف. بعض البيانات من اقترح بحث أن اليكسا قد لا تتعامل مع جميع المتحدثين على قدم المساواة ، ولكن مجموعة أكبر من البيانات المنطوقة كلمة ستكون هناك حاجة للحصول على مقبض حقيقي في نطاق هذه المسألة.

الباحثون يدرسون أيضا موضوعات البحث حول تأثير الثقة في أجهزة إنترنت الأشياء. “إذا كان المهاجم يدرك أن المستخدمين يثقون في واجهات الصوت أكثر من أشكال أخرى من حساب ، “كتبوا في ورقتهم ،” قد بناء أفضل ، المزيد من الهجمات المستهدفة على واجهات الصوت. “ويأمل الفريق لاستكشاف أنواع أخطاء المعالجة الموجودة على الآخر منصات معالجة اللغة.

“كمشكلة واجهة” ، قال بيتس ، “ليس هناك قاع ل هذه.”

Like this post? Please share to your friends:
Leave a Reply

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: