Komponen

Selamat datang di Web 3.0: Pencarian Semantik

Review: Quiz 1

Review: Quiz 1
Anonim

Mode kata kunci di mana-mana teknik pencarian Internet akan diambil alih oleh generasi baru teknologi pencarian semantik, menurut analis di firma riset Ovum.

Meskipun pencarian kata kunci tetap metode yang paling populer, itu biasanya tidak akurat, dengan pengguna terkadang mendapatkan hingga 30.000 klik pada pencarian dan kemudian harus menyaring daftar hasil kata kunci yang terkait secara longgar untuk menemukan dokumen yang relevan.

"Di sinilah jenis baru dari apa yang disebut teknologi semantik masuk ke dalam bingkai. Tidak seperti peringkat algoritma seperti Google PageRank untuk memprediksi relevansi, pencarian semantik dips ke makna dalam bahasa untuk menghasilkan hasil pencarian yang sangat relevan, "menurut laporan yang diterbitkan oleh analis Ovum Mike Davis dan Madan Sheina.

Terkemuka semanti penyedia web c dipilih oleh para analis termasuk Sistem Pakar, Powerset, Yedda, Trovix dan Hakia. Menurut penulis, kesadaran pencarian semantik meningkat ketika Microsoft mengambil dua perusahaan pencarian semantik Powerset dan Zoomix.

Dalam kasus Sistem Pakar, penerapannya, disebut Cogito, dirancang di sekitar prinsip-prinsip pemahaman manusia untuk memungkinkan konten untuk dipahami dengan cara yang dimaksudkan oleh si penulis. Ini adalah sesuatu yang diabaikan oleh pencarian kata kunci.

"Pencarian Google untuk kata 'jaguar' akan menarik konten di sekitar hewan dan mobil. Pencarian semantik akan terlihat tidak hanya pada kata kunci tetapi juga kata-kata lain di sekitarnya seperti 'rimba 'atau' saloon 'untuk memisahkan dua makna, "kata para penulis.

Analisis lebih dalam

Selain pencarian semantik, ada bentuk lain, termasuk heuristik dan ontologi, linguistik dan penambangan teks, dan statistik. Namun, Sistem Pakar mengklaim bahwa pendekatan ini gagal, hanya menangani aspek-aspek analisis morfologis dan tata bahasa.

Mesin pencari lainnya sering menabrak dinding bata ketika datang ke analisis mendalam. Sebagai contoh, ketika sebuah mesin pencari yang dikendalikan secara heuristik melihat dua kata sifat dalam sebuah kalimat, biasanya ia mencuci mereka dan menilai kalimat itu netral karena tidak memiliki pemahaman tentang di mana dua kata sifat yang terpisah menunjuk.

Sebagai perbandingan, pencarian semantik terlihat di kedua kalimat logika - bagaimana kata-kata dalam sebuah kalimat berhubungan satu sama lain - dan analisis semantik - memahami konteks kata kunci.

Ketika sebuah istilah ambigu, yang berarti dapat memiliki beberapa arti, misalnya, kulit kayu, analisis semantik diperlukan. dengan kata lain yang membungkusnya untuk memberikan makna dan konteks yang sebenarnya.

Database leksikal

Para insinyur di Sistem Pakar mengatakan Cogito dapat bekerja ekstra karena memiliki jaringan semantik - database leksikal yang memberikan representasi pengetahuan tentang definisi kata dan hubungannya. Ini menuangkan kamus Webster ke dalam basis data di memori - yang terdiri dari 350.000 kata dan 2,8 juta hubungan.

"Jaringan semantik Sistem Pakar juga berfokus pada kata-kata umum. Itu berbeda dari kebanyakan pendekatan ontologis yang menyibukkan diri dengan pembungkusan makna dan konteks sekitar khusus. konten, seperti istilah ilmiah, dan melewatkan kata-kata umum yang terdiri dari 90 persen dari semua konten, "kata para penulis Ovum.

Namun, pencarian semantik masih penuh dengan" banyak hype teoritis tetapi sedikit substansi atau bukti nyata bahwa ini bekerja lebih baik daripada teknologi pencarian saat ini.

"Jaringan semantik sulit untuk dibangun dan tidak semuanya sama. Tidak mungkin teknologi semantik akan mampu memberikan presisi 100 persen dalam analisis dan hasil mereka. Selain itu masih ada tanda tanya atas masalah kinerja yang berpotensi lengket dengan pencarian semantik yang memakan lebih banyak siklus pemrosesan. "