Kecerdasan Buatan : NATURAL LANGUAGE PROCESSING - Pertemuan 10
NATURAL LANGUAGE PROCESSING
MODEL-MODEL AI
1. Natural Language Processing (NLP)
2. Computer Vision
3. Robotika dan Sistem Navigasi
4. Game Playing
5. Sistem Pakar (expert system)
PEMBAHASAN
ü
Apa itu Natural language processing
ü
Pendekatan Natural language processing
ü
Teknik dalam Natural language processing
ü
Pembagian Natural language processing
ü
Tahapan Proses Natural language processing
ARTIFICIAL INTELLIGENT
§
Secara sederhana, Artificial Intelligence merupakan program yang memungkinkan
komputer untuk berpikir cerdas seperti atau lebih dari manusia.
§
Dengan Artificial Intelligence, komputer dapat berpikir, melakukan analisis,
mengambil keputusan, hingga memecahkan masalah selayaknya manusia.
§
Seiring dengan teknologi komputer yang makin berkembang, kehadiran Artificial
Intelligence makin dekat dengan keseharian manusia.
§
Contoh Chatbot merupakan salah satu wujud terapan AI dari cabang natural
language processing (NLP).
APA ITU NLP ?
§
Natural language processing (NLP) adalah cabang dari kecerdasan buatan yang
berhubungan dengan interaksi
antara komputer dan manusia menggunakan bahasa
alami.
§
Menurut Textmetrics, NLP digunakan untuk mengukur sentimen dan menentukan
bagian mana dari bahasa manusia yang penting.
§
Pemroses bahasa alami (Natural Language Processing/NLP) adalah suatu aplikasi
(program) dalam bidang AI yang dapat mengartikan suatu bahasa baik bahasa tulisan maupun bahasa lisan atau
memproses masukan yang berupa bahasa menjadi suatu informasi atau pengetahuan.
Natural Language Processing
§
Natural language processing digunakan untuk aplikasi berikut ini :
1. Aplikasi terjemahan bahasa seperti Google Translate.
2. Aplikasi pengolah kata seperti Microsoft Word dan
Grammarly, yang menggunakan NLP untuk memeriksa keakuratan tata bahasa teks.
3. Aplikasi chatbot ataupun Interactive Voice Response (IVR)
untuk menanggapi permintaan pengguna tertentu.
4. Aplikasi personal assistant seperti OK Google, Siri,
Cortana, dan Alexa.
5. Penamaan lokasi. Aplikasi seperti Gojek dan Grab yang
dapat memberi nama suatu lokasi berikut titik jemput yang lebih mendetail
Google Translate
Rinna –
Chatboot Buatan Microsoft
Yuu –
Chatboot Buatan Indonesia
Tasia – Chatboot Informasi Soal Auto2000
Cinta BNI – Chatboot
BNI
Personal Assistant
Pendekatan NLP
§ Ada
berbagai pendekatan yang digunakan agar komputer dapat memahami bahasa manusia.
1. Pendekatan simbolik
2. Pendekatan statistik
3. Pendekatan koneksi
§
Pendekatan Simbolik
§
Pendekatan simbolik menggunakan pendekatan yang berdasarkan pada aturan dan leksikon yang
dikembangkan manusia.
§
Artinya, sistem menerima aturan bicara dalam bahasa tertentu yang diwujudkan
dan direkam oleh pakar linguistik untuk diikuti.
§
Pendekatan Statistik
§
Pendekatan statistik didasarkan pada contoh fenomena linguistik yang dapat
diamati dan berulang.
§ Sistem mengenali tema berulang
melalui analisis matematis.
§
Setelah mengidentifikasi tren
dalam sampel teks yang besar, sistem komputer dapat mengembangkan aturan
linguistiknya sendiri yang akan digunakan untuk menganalisis input bahasa yang
digunakan.
§
Pendekatan Koneksi
§
Pendekatan koneksi merupakan pendekatan yang menggabungkan pendekatan simbolik dan pendekatan statistik.
§ Hal
ini dimulai dengan menggunakan aturan bahasa secara umum dan menyesuaikannya
dengan aplikasi spesifik dari input yang berasal dari pendekatan statistik.
Teknik dalam NLP
§
Natural language processing menggunakan dua teknik untuk menyelesaikan
tugasnya.
1. Syntax
2. Semantics
§ Syntax
• Syntax mengacu pada susunan kata-kata dalam sebuah kalimat sehingga tampak masuk
akal secara tata bahasa.
• Natural language processing menggunakan analisis syntax
untuk menerapkan aturan tata
bahasa pada kumpulan kata yang ditemukannya.
§ Ada
beberapa teknik syntax yang bisa digunakan.
1. Lemmatization, melakukan pengurangan berbagai bentuk kata
yang berubah menjadi satu bentuk untuk memudahkan analisis. Contoh kata dari
“swim”, “swimming”, “swims”, “swam”, adalah semua bentuk dari “swim”. Nah jadi
lemma dari semua kata-kata tersebut adalah “swim”.
2. Segmentasi morfologis, melibatkan pembagian kata menjadi
unit-unit individu atau morfem.
3. Segmentasi kata, membagi sebagian besar teks
berkelanjutan menjadi unit-unit berbeda.
4. Penandaan part-of-speech, dengan mengidentifikasi bagian
dari ucapan untuk setiap kata.
5. Parsing, dengan melakukan analisis tata bahasa untuk
kalimat yang disediakan. contoh, “Budi”. Ketika kita ingin mengajar anak kecil,
kita sering kali memecahkan kalimat atau kata per elemennya. “B, U, BU”. “D, I,
DI”, “Budi”.
6. Pemutusan kalimat, dengan menempatkan batas kalimat pada
sepotong teks besar.
7. Stemming, memotong kata-kata yang diubah ke bentuk
akarnya. Contoh “bi” di awal kata “bicycle”, “er” di akhir kata “lighter”
§ Semantics
• Semantics mengacu pada makna yang disampaikan oleh sebuah teks.
• Ini merupakan aspek yang paling sulit dianalisis dalam
natural language processing dan belum sepenuhnya dipelajari.
• Analisis ini melibatkan penerapan algoritma komputer untuk
memahami arti dan interpretasi kata-kata dan bagaimana kalimat disusun.
§
Berikut beberapa teknik semantics yang umum digunakan dalam Natural language
processing .
1. Named entity recognition (NER), melibatkan penentuan
bagian-bagian teks yang dapat diidentifikasi dan dikategorikan ke dalam grup
tertentu. Contohnya nama orang dan nama tempat.
2. Disambiguasi arti kata, melibatkan pemberian makna pada
kata berdasarkan konteksnya.
3. Natural language generation, melibatkan penggunaan
database untuk mendapatkan maksud semantik dari teks dan mengubahnya menjadi
bahasa manusia.
PEMBAGIAN NLP
§
Masalah pemrosesan bahasa alami dibagi menjadi dua bagian besar, yaitu :
1. Pemrosesan Naskah Tertulis : menggunkan pengetahuan
tentang leksikal, sintax, dan semantic.
2. Pemrosesan Bahasa Lisan : menggunakan semua pengetahuan
dari pemrosesan naskah tertulis ditambah pengetahuan tentang phonology.
MASALAH DALAM NLP
§
Beberapa masalah yang dihadapi dalam pemrosesan bahasa alami antara lain adalah
:
1. Suatu kalimat sering kali tidak lengkap, artinya tidak
memberi informasi yang jelas atau lengkap
2. Satu kalimat dapat memiliki lebih dari satu
pengertiandalam konteks yang berbeda
3. Tidak ada program pemroses bahasa alami yang cukup
lengkap karena bahasa selalu berkembang, kosa kata selalu bertambah.
4. Bisa terdapat lebih dari satu cara (lebih dari satu
kalimat) untuk mengungkapkan hal(maksud) yang sama.
Tahapan Proses NLP
§
Untuk memproses bahasa alami diperlukan 5 langkah sebagai berikut :
1.
Analisis Morpology
• Pada tahap ini dilakukan analisa untuk
setiap kata dan komponen yang dimiliki tiap kata termasuk token non kata
seperti spasi, tanda baca, tanda pemisah.
2.
Analisis Sintax
• Pada tahap ini sederetan kata disusun
kedalam struktur yang memperlihatkan bagaimana hubungan satu kata dengan kata
lainnya. Deretan kata akan ditolak bila tidak memenuhi aturan penyusunan kata
yang ada.
3.
Analisis semantik
• Pada tahap ini struktur deretan kata yang
sudah terbentuk akan diberi arti. Dengan kata lain pemetaan dibuat antara
struktur sintax dengan object yang berhubungan.
4.
Penyatuan Arah (konteks)
• Pada tahap ini arti dari suatu kalimat
disesuaikan dengan kalimat-kalimat lain, karena arti dari suatu kalimat
biasanya berhubungan dengan kalimat sebelumnya dan kalimat sesudahnya.
5.
Analisis Pragmatis
• Struktur yang terbentuk menghasilkan
interpretasi ulang dari apa yang sudah dikatakan atau ditulis sebelumnya dengan
arti yang sebenarnya.
Grammar dan Parser
§
Grammar adalah suatu aturan yang menentukan bagaimana suatu kalimat dalam suatu
bahasa dibentuk. Grammar berisi kumpulan sintax yang baku/benar dari suatu
bahasa.
§
Contoh : Dalam bahasa Indonesia, suatu kalimat biasanya terdiri dari
• Subject-Predikat-Object-Keterangan
§
Parsers adalah suatu metode atau suatu program (sering disebut suatu mesin)
yang dapat memproduksi/menghasilkan kalimat atau bahasa yang sesuai dengan
Grammar yang sudah ditentukan atau diinginkan. Parsers juga dapat memeriksa
apakah suatu kalimat yang dimasukkan sesuai dengan Grammar atau tidak.
Jenis Parser
§
Parsers terdiri dari dua jenis, yaitu :
1. Top-Down Parsing : memulai proses
parsing dari simbol start dan menggunakan aturan grammar sampai simbol-simbol
terminal pada tree terhubung ke komponen kalimat yang di parsing.
2. Bottom-Up Parsing : memulai proses parsing
dari kalimat yang akan di parsing dan menggunakan aturan grammar secara
terbalik untuk memproduksi kata menjadi terminal, terminal menjadi kalimat
sampai tree/ pohon lengkap dan simbol start tercapai
Komentar
Posting Komentar