Дамерау-Левенштейны засварын зай
хоёр тэмдэгт мөрийн хоорондын засварлалтын зай
Эх хэлний боловсруулалтын салбарт доорх засварын үйлдлүүдийг хэдэн удаа ашиглан нэг тэмдэгт мөрийг нөгөө тэмдэгт мөр болгон хувиргаж болохыг Дамерау-Левенштейны зай (Damerau–Levenshtein distance) гэдэг:
- Оруулах
- Устгах
- Орлуулах
- Хөрш хоёр үсгийг солих
Уг ойлголтыг үгийн бичлэгийн алдаа засах асуудалд өргөн ашигладаг.
Доорх хүснэгтэнд зөвшөөрөгдөх үйлдлүүдийн жишээг үзүүлэв:
Алдаатай үг | Засах хувилбар | Зөв үсэг | Алдаатай үсэг | Үйлдлийн төрөл |
---|---|---|---|---|
хамад | хамаг | г | д | орлуулах |
хамад | хаад | - | м | оруулах |
хамад | хамаад | а | - | устгах |
хамад | ахмад | ха | ах | хөрш хоёр үсгийг солих |
Машин сургалтанд алдаа засах асуудлыг шийдэх үед ихэвчлэн дайралддаг алдаануудын жагсаалт хэрэг болдог ба англи хэлний хувьд ийм жагсаалтын жишээ нь Питер Норвигийн үүсгэсэн Дамерау-Левенштейний 1 зайтай алдааны жагсаалт юм (http://norvig.com/ngrams/spell-errors.txt).