alexa-tracking

Mohon Pencerahan php mysql

Main Content

1024
1024
KASKUS
51
244
https://www.kaskus.co.id/thread/56fb4c0a1cbfaa91468b4567/mohon-pencerahan-php-mysql
Mohon Pencerahan php mysql
Selamat Siang para master-master.
newbie mau numpang tanya ni untuk kasus seperti berikut kira2 metode apa yang bisa ane pakai ya.

Misalkan ada 4 record di field alamat.
1. Jalan Panjang no 12
2. Jl Panjang no 12
3. Jln Panjang no 12
4. Jalan Pnjang no 12

nah untuk 4 record di atas sebenarnya merupakan record dengan artian yang sama, hanya saja beda di penulisan.
pertanyaannya apakah ada cara atau metode atau teknik di mysql yang bisa di gunakan untuk mengelompokkan atau menganggap sama artinya antara keempat record tersebut.

Mohon maaf jika berantakan atau sulit dimengerti pertanyaan ane.
Mohon pencerahannya para master.
emoticon-Malu
mysql mana tahu kalo itu sama emoticon-Malu
sebaiknya pas insert disandarin dari programnya
misal semuanya di convert ke jl
Quote:


Salah satunya caranya adalah dengan NLP
https://en.wikipedia.org/wiki/Natural_language_processing
Quote:

tq gan masukannya.

Quote:

wah, ane cek tkp dlu gan. tq infonya.
saran sih standarin penulisannya... emang problema umum sebagai programmer sih itu...

kalo mau diubah stringny pake NLP .. blum pernah nyoba sih.. atau make motong2 string gitu.. ambil Panjang nya ama nomornya emoticon-Jempol
Harus nya filter saat user input data ke data standart anda, tapi kalau gini kasusnya berarti "nasi sudah jadi bubur"
Biar menjadi "bubur ayam" coba pakai list nama-nama yg perlu di standarisasi

Mungkin:
1. Pakai regular expression
2. Pakai REPLACE
harus nya hal seperti ini dimonimalisir saat penginputan awal dengan ketentuan-ketentuan input kalo begitupaling SELECT WHERE LIKE saja gan.. emoticon-Hammer2
atas ane bener bisa juga jadi replace jadi misal na ada beberapa field input dari user seperti
jalan,jln, jlan,jaln di replace yg memungkinkan diinput user menjadi Jl misalnya seperti itu..
Quote:

Haha. memang kalau untuk menstandarkan inputan menggunakan textbox udah jadi problem. btw tq masukkannya.

Quote:

mungkin pakai replace ke standar format kali ya lbh ga ribet. tq gan.

Quote:

udah di coba pake like tapi yaa.. hasilnya ga memuasnya. akurasi nya kecil. haha. thx gan.
mungkin ntar bisa kembangin APi yang fungsinya mengeneralkan penulisan bentuk yang bermacam2 tapi mempunyai makna sama.emoticon-Shakehand2
Quote:


Kalau pakai bahasa PHP, mungkin agan bisa coba memanfaatkan fungsi berikut untuk menghitung persamaan dari string:
link.

Kalau agan menggunakan bahasa program yang bukan PHP, bisa di cari-cari dulu, nama algoritmanya Levenshtein. Sepertinya banyak versi bahasa program lainnya, termasuk function untuk MySQL.
Quote:

Mantap suhu infonya. coba oprek2 dlu, mana yang lbh pas. dulu sih pernah pakai algoritma distance2 kayak begituan buat template matching, cuma ya di Matlab, kalau di php sy masih belajar dan super newbie. dpt artikel lagi kayaknya metaphone jga bisa. hehe.
btw Thx gan. emoticon-Salaman
Quote:


mantap nih saya malah baru tau ada levenshtein();
Quote:

iya ni gan, baru tau juga php ada function built in kayak beginian. emoticon-Malu

Ada beberapa opsi gan.
1. Kasih keterangan penulisan standar di input nya.
2. Pakai fungsi replace() duet sama array()
3. Pakai fungsi levenshtein()
Saran ane yang ketiga gan, enak gak ribet ribet amat emoticon-Blue Guy Smile (S)
Quote:


Quote:


Thx gan sarannya. uda di baca2. berarti kalau pakai levenshtein perlu database master sebagai pembanding untuk string query yang masuk ya? emoticon-Malu
Quote:


gak perlu gan, cukup pake array
Quote:

sip bro tq ya.