Car-tech

Windows Phone 7 to Excel on Speech

Office 365 and Windows Phone 7 | Pocketnow

Office 365 and Windows Phone 7 | Pocketnow
Anonim

Berharap untuk melompati Google dan keberhasilan Apple di pasar smartphone, Microsoft berencana untuk menggunakan pengenalan suara berbasis cloud dan teknologi pemrosesan bahasa alami untuk menawarkan kemampuan antarmuka pengguna yang tidak ditemukan pada perangkat iPhone atau Android.

"Kami percaya bahwa pidato bukanlah aplikasi yang terpisah. ini merupakan bagian integral dari pengalaman pengguna, "kata Zig Serafin, manajer komunikasi terpadu Microsoft, sebelum hadirin pada konferensi SpeechTEK 2010, yang diadakan minggu ini di New York.

Untuk meningkatkan kemampuan Windows Phone 7 untuk memahami perintah suara dan memberikan hasil yang diminta, perusahaan berencana untuk mengikat di Windows Phone 7 handset dengan pengenalan suara berbasis cloud Tellme dan layanan pemrosesan bahasa alami, kata Se rafin, dalam wawancara berikutnya dengan IDG News Service.

[Bacaan lebih lanjut: Ponsel Android terbaik untuk setiap anggaran.]

Microsoft membeli perusahaan yang menciptakan layanan ini, Tellme Networks, pada 2007.

Sebelum audiensi SpeechTEK, Serafin mengecam sistem operasi Android dan iPhone karena menggunakan ikon sebagai bentuk interaksi utama. "Kebanyakan ponsel pintar adalah kisi-kisi ikon, seperti Windows 3.1," katanya.

Berbicara di telepon adalah cara yang lebih alami untuk mengatakan apa yang harus dilakukan, katanya. "Ketika Anda pindah ke perangkat yang tidak memiliki keyboard besar, suara adalah pelengkap yang menarik untuk pengalaman itu," kata Serafin.

Dia kemudian memiliki direktur pemasaran Microsoft Ilya Bukshteyn melalui demonstrasi bagaimana Windows Phone 7 dapat menggunakan pengenalan suara dan pemrosesan bahasa alami, atau sarana yang digunakan komputer untuk menginterpretasikan apa yang dikatakan seseorang. Bukshteyn meminta telepon untuk memanggil "Paul," dan suara yang dikeluarkan dari handset menjawab dengan sejumlah kontak yang berbeda dengan nama depan Paul. Bukshteyn menjawab dengan nama lengkap yang spesifik dan telepon melanjutkan untuk memanggil orang itu.

Bukshteyn juga mengatakan kepada telepon untuk membuka album gambar, dan aplikasi tampilan gambar muncul di layar, menunjukkan tidak hanya foto yang diambil oleh pengguna, tetapi juga diambil oleh teman pengguna yang diposting di situs jejaring sosial.

Dalam contoh ketiga, Bukshteyn meminta daftar restoran Cina terdekat. Permintaan itu disampaikan ke layanan pencarian Bing, yang mengembalikan daftar restoran dan lokasinya di peta.

Sementara iPhone dan varian Android memang menggunakan beberapa kemampuan pengenalan suara, layanan telepon Microsoft akan berbeda dalam sejumlah hormat, kata Serafin. Untuk satu, itu tidak akan dibatasi untuk digunakan hanya dalam beberapa aplikasi, tetapi bisa digunakan untuk mengontrol seluruh telepon. Cara kedua di mana layanan ini akan unik adalah bahwa itu akan menjadi interaktif. Jika diberi perintah ambigu, handset atau layanan yang sesuai dapat meminta pengguna untuk mengklarifikasi permintaan.

Komponen bicara adalah salah satu bagian dari apa yang disebut Serafin sebagai "antarmuka pengguna alami" atau NUI. NUI bergantung pada suara, sentuhan dan bahkan gerakan sebagai bentuk input.

"Pidato adalah inti dari NUI," katanya. Bagian dari demonstrasi menunjukkan bagaimana teknologi Microsoft Kinnect XBox dapat mengartikan gerakan tangan untuk memicu tindakan di komputer. Teknologi ini akan digunakan dalam produk Microsoft di luar XBox, Bukshteyn mengatakan dalam wawancara berikutnya dengan IDG.

Serafin mengatakan bahwa perusahaan ini dalam proses awal interaksi pembicaraan bergulir ke dalam berbagai komponen Windows Phone 7, dimulai dengan yang paling berat digunakan - mencari, memanggil orang, dan membimbing pengguna ke koleksi foto.

Seorang pengguna dapat memicu telepon untuk mendengarkan perintah suara dengan menekan satu tombol di telepon. Beberapa pemrosesan bahasa akan dilakukan di telepon dan beberapa akan dilakukan oleh Tellme. "Jujur, pengguna tidak boleh tahu atau peduli tentang" di mana perintah suara diproses, kata Bukshteyn.

Serafin mengklaim bahwa layanan Tellme adalah sistem pemrosesan bahasa alami berbasis ujaran lisan terbesar yang digunakan saat ini. Microsoft meluncurkan layanan ke organisasi-organisasi besar untuk dukungan bantuan meja berbasis telepon. Bidang layanan lebih dari 2,5 miliar panggilan setahun untuk klien perusahaan, katanya.

Joab Jackson mencakup perangkat lunak perusahaan dan teknologi umum melanggar berita untuk The IDG News Service. Ikuti Joab di Twitter di @Joab_Jackson. Alamat e-mail Joab adalah [email protected]