Alexa, Siri ve Google Söylediğiniz Bir Kelimeyi Anlama

Amazon

Alexa, Google Assistant ve Siri gibi ses yardımcıları son birkaç yılda çok yol kat etti. Ancak, tüm gelişmeleri için bir şey onları geride tutuyor: Sizi anlamıyorlar. Belirli ses komutlarına çok fazla güveniyorlar.

Konuşma tanıma sadece bir sihir numarasıdır

Amazon

Sesli asistanlar seni anlamıyor. Zaten pek değil. Bir Google Ana Sayfası veya Amazon Yankı ile konuştuğunuzda, kelimelerinizi bir metin dizisine dönüştürür ve bunu beklenen komutlarla karşılaştırır. Tam bir eşleşme bulursa, bir dizi talimat izler. Olmazsa, hangi bilgilere sahip olduğuna bağlı olarak ne yapılması gerektiğine dair bir alternatif arar ve bu işe yaramazsa “Özür dilerim ama bunu bilmiyorum” gibi bir hata mesajı alıyorsunuz . ”El büyüsünün çabukluğundan biraz daha fazlası, sizi anladığını düşündürmek için kandırmak.

En iyi tahminde bulunmak için bağlamsal ipuçlarını kullanamaz veya kararlarını bildirmek için benzer konularda bir anlayış kullanamaz. Sesli asistanları da gezdirmek zor değil. Alexa’ya “NSA için mi çalışıyorsunuz?” Diye sorabilirsiniz ve “NSA’nın gizlice bir parçası mısınız?” Diye sorarsanız, “bunu bilmiyorum” cevabını alırsanız (en azından bu yazının zamanı).

Konuşmayı gerçekten anlayan insanlar, bu şekilde çalışmaz. Diyelim ki bir insana, “Gökyüzündeki bu klarvain nedir? Kemerli ve kırmızı, turuncu, sarı ve mavi gibi çizgili renklerle dolu olanı. ”Klarvain, telafi edici bir kelime olmasına rağmen, sorduğunuz kişi muhtemelen bir gökkuşağı tanımladığınız bağlamdan anlayabilir.

Bir insanın konuşmayı fikirlere dönüştürdüğünü iddia ederken, bir insan daha sonra bir cevap çıkarmak için bilgi ve anlayışı uygulayabilir. Bir insana gizlice NSA için çalışıp çalışmadıklarını sorarsanız, bu cevap yalan olsa bile size evet veya hayır cevabı verir. Bir insan böyle bir soruya “Bunu bilmiyorum” demez. İnsanların yalan söyleyebilmesi gerçek bir anlayışla gelen bir şeydir.

Sesli Asistanlar Programlarının Ötesine Geçemez

Sesli asistanlar nihayetinde programlanan beklenen parametrelerle sınırlıdır ve bunların dışında dolaşmak işlemi bozacaktır. Bu gerçek, üçüncü parti cihazların ne zaman çalınmaya başladığını gösteriyor. Genelde, bunlarla etkileşime girme komutu “aygıt üreticisine isteğe bağlı argümanı yönetmesini söyle” şeklinde belirsizdir. Kesin bir örnek şöyledir: “Whirlpool'a kurutucuyu duraklatmasını söyleyin.” Örneği hatırlamak daha da zor, Geneva Alexa Beceri bazı GE fırınlarını kontrol ediyor. Yetenekli bir kullanıcının komutun geri kalanından sonra "GE'ye" değil "Cenevre'ye söylemeyi" hatırlaması gerekir. Ve fırını 350 dereceye ısıtmasını isteyebilirken, sıcaklığı 50 dereceye kadar artırma talebini takip edemezsiniz. Bir insan bu istekleri olsa izleyebilir.

Amazon ve Google bu engellerin üstesinden gelmek için çok çalıştılar ve gösteriyor. Akıllı kilidi kontrol etmek için yukarıdaki sırayı izlemeniz gerektiğinde, şimdi bunun yerine “ön kapıyı kilitleyin” diyebilirsiniz. Alexa, “bana bir köpek şakası söyle” ile karıştırılırdı, ancak bugün bir tane isteyin ve işe yarayacaktır. Kullanmakta olduğunuz komutlara birtakım varyasyonlar eklediler, ama nihayetinde hala söyleyeceğin doğru komutu bilmen gerekiyor. Doğru sözdizimini doğru sırada kullanmanız gerekir.

Ve bunun komut satırı gibi göründüğünü düşünüyorsanız, yanılmıyorsunuzdur.

Sesli Asistanlar Süslü Bir Komut Satırıdır

Bir Komut Satırı, basit görevleri gerçekleştirmek için dar bir şekilde tanımlanmıştır, ancak yalnızca uygun sözdizimini biliyorsanız. Bu doğru sözdiziminden çıkıp dir yerine dyr yazarsanız, komut istemi size bir hata mesajı verir. Takma adları daha kolay hatırlamak için takma adlar kullanabilirsiniz, ancak orijinal komutların ne olduğu, nasıl çalıştıkları ve takma adların verimli bir şekilde kullanılması hakkında fikir sahibi olmalısınız. Giriş ve komut satırlarını öğrenmek için zaman ayırmazsanız, bundan fazla bir şey alamazsınız.

Sesli asistanlar farklı değil. Bir komut söylemenin veya bir soru sormanın doğru yolunu bilmeniz gerekir. Ve Google ve Alexa için grupları nasıl ayarlayacağınızı, cihazlarınızı neden gruplandırmanız gerektiğini ve akıllı cihazlarınızı nasıl adlandıracağınızı bilmeniz gerekir. Bu gerekli adımları izlemezseniz, ses asistanınızdan çalışmayı yalnızca sorulmasını istemesi, “hangi çalışmanın” kapatılması gerektiği sorusundaki hüzünlü hissedeceksiniz.

Doğru sözdizimini doğru sırada kullansanız bile, işlem başarısız olabilir. Ya yanlış cevap verildi ya da şaşırtıcı bir sonuç çıktı. Aynı evde bulunan iki Google Evi, aynı kullanıcı hesabı bilgilerine ve internet bağlantısına erişmelerine rağmen biraz farklı yerler için hava verebilir.

Yukarıdaki örnekte, “Yarım saatliğine zamanlayıcı ayarla” komutu verilmiştir. Google Ana Sayfa merkezi “Saat” adında bir zamanlayıcı oluşturdu ve ardından zamanlayıcının ne kadar süreceğini sordu. Yine de aynı komutu üç kez daha tekrarlamak doğru bir şekilde çalıştı ve 30 dakikalık bir zamanlayıcı oluşturdu. “Zamanlayıcıyı 30 dakikaya ayarla” komutunu kullanmak daha tutarlı bir şekilde çalışır.

Bir Google Ana Sayfası veya Yankı ile konuşma daha akıcı olsa da, başlık ses asistanları ve komut satırları aynı şekilde çalışır. Yeni bir dil öğrenmeniz gerekmeyebilir, ancak yeni bir lehçe öğrenmeniz gerekir.

Sesli Asistanların Dar Anlayışı Büyümeyi Sınırlayacak

Bunların hiçbiri Google Assistant ve Alexa gibi ses asistanlarının yeterince çalışmasını engellemiyor (Cortana farklı bir hikaye olsa da). Google Asistanı ve Alexa ve çevrimiçi olarak sorularınızı iyi araştırın, şaşırtıcı olmasa da Google aramada daha iyidir ve ölçüm dönüşümleri ve basit matematik gibi temel soruları cevaplayabilir. Doğru ayarlanmış bir akıllı ev ve iyi eğitilmiş bir kullanıcıyla, çoğu akıllı ev komutu amaçlandığı şekilde çalışır. Fakat bu entelektüel anlayışın değil işin ve çabanın sonucu oldu.

Zamanlayıcılar ve Alarmlar basitti. Zamanla adlandırma, daha sonra bir zamanlayıcıya zaman ekleme kabiliyeti eklendi. Basitten karmaşıklığa geçtiler. Sesli asistanlar daha fazla soruya cevap verebilir ve her gün yeni beceriler ve özellikler getirir. Ancak bu, öğrenme ve anlamadan gelen bir kişisel gelişim ürünü değildir.

Ve bunların hiçbiri, bilinmeyene ulaştığı bilinen şeyi kullanma doğal yeteneği sağlamıyor. İşe yarayan her emir ve soru için, her zaman işe yaramayan üç olacaktır. AI'da insani anlama kabiliyeti veren bir atılım olmadan, Sesli asistanlar asistan değildir. Bunlar sadece sesli komut satırlarıdır – doğru senaryoda kullanışlıdır, ancak anlamak için programlandıkları senaryolarla sınırlıdır.

Başka bir deyişle: makineler bir şeyler öğreniyor, ama onları anlayamıyor.

İLGİLİ: AI ile İlgili Sorun: Makineler Şeyleri Öğreniyor, Ama Anlayamıyor