12 digitala produktidéer för att tjäna mer pengar snabbt Uncategorized Microsofts nya röstigenkänningsteknologi kan översätta din naturliga röst till ett annat språk [Video]

Microsofts nya röstigenkänningsteknologi kan översätta din naturliga röst till ett annat språk [Video]

Det finns lite av en röstkommandokamp som pågår just nu i det mobila utrymmet, med Apples digitala Siri -assistent och Googles röstsökning Att använda det mot varandra för användarnas lidande. Båda kommer med sin egen uppsättning för- och nackdelar och kommer bara att bli bättre när vi går framåt i framtiden, men det verkar som om Microsofts forsknings- och utvecklingsgrupper har arbetat med något röst baserat på sina egna bakom kulisserna som kan förändra vägen Människor interagerar med varandra.

Även om Siri är mycket kraftfullare än Googles röstsökning på iOS-plattformen, arbetar de båda i allmänhet på samma sätt genom att fånga hörbara kommandon från användaren innan de publicerar och bearbetar det kommandot på en back-end-server innan de spottar resultatet Tillbaka till användaren och agera på begäran. En video har publicerats av Microsoft med en presentation från Rick Rashid som beskriver de förbättringar som företaget har gjort inom området naturliga användargränssnitt med mänskligt tal.

Datorbaserade system som förstår mänskligt tal är inte en ny uppfinning. Vi har sett många utgåvor under åren som visar betydande framsteg inom detta område, med Siri och Google Voice -sökning som ett par av de senaste exemplen på hur denna teknik kan tillämpas i den verkliga världen. Men Microsoft har tyst försökt ta saker några steg dessutom genom att bygga ett system kring tekniker som inte bara kan känna igen mänskligt tal utan också översätta det till text till ett främmande språk och sedan upprepa orden på det språket med en syntetiserad röst som genereras att låta som högtalaren.

Demonstrationen på scenen med Microsofts Chief Research Officer visar tekniken i aktion genom att erkänna sina talade engelska ord, omvandla dem till kinesiska på den beräknade skärmen och sedan hört tillkännager exakt samma mening tillbaka i mandarin. Allt detta är att tänka nog, men då tas saker lite dessutom när du inser att Rashid och hans kollegor har matat systemet med över en timmes värde av sina egna röstdata för att låta systemet upprepa meningen i mandarin med sin egen röst!

Tekniken är inte bäst och den gör fortfarande misstag, men det är verkligen häpnadsväckande att inse att detta är möjligt. Framtiden för mänsklig interaktion är absolut i horisonten.

(via Technetblog)

Du kan följa oss på Twitter, lägga till oss i din cirkel på Google+ eller gilla vår Facebook -sida för att hålla dig uppdaterad om all ström från Microsoft, Google, Apple och webben.

Leave a Reply

Your email address will not be published. Required fields are marked *