ပိုမိုကောင်းမွန်သော ဘာသာပြန်ရရှိရန် သချင်္ာကို အသုံးပြုသည့် Facebook ၏ သုတေသနပြုသူများ

ပိုမိုကောင်းမွန်သော ဘာသာပြန်ရရှိရန် သချင်္ာကို အသုံးပြုသည့် Facebook ၏ သုတေသနပြုသူများ
Published 13 October 2019
နရီမင်း

ဘာသာပြန်စက်ကို ဒီဇိုင်းရေးဆွဲကြသူများသည် နိုင်ငံခြားဘာသာစကားတစ်ရပ်ကို နားလည်အောင်ပြုလုပ်ရန်အတွက် အဘိဓာန်များပေါ်၌ အကြီးအကျယ်မှီခိုနေရဆဲဖြစ်သည်။ သို့သော် ယခုအခါ နည်းလမ်း တစ်ရပ်ရှိလာသည်။ ယင်းမှာ ဂဏန်းများကို အသုံးပြုခြင်းဖြစ်သည်။

Facebook ၏ သုတေသနပြုသူများသည် စကားလုံးများကို ကိန်းဂဏန်းများအဖြစ်သို့ ပြောင်းလဲပြီး ဘာသာစကားများအကြား သချင်္ာဆိုင်ရာ တူညီမှုများကို အသုံးပြုလာခြင်းက ကမ္ဘာက အသုံးပြုနေသော ဆက်သွယ်ရေးစနစ်တစ်ရပ်ဖြစ်သည့် Star Trek က ဝေးကွာသည့် အိပ်မက်တစ်ရပ် ဖြစ်နေလျှင်ပင် အလားအလာကောင်းသော နည်းလမ်းတစ်ခုဖြစ်လာသည်။

အားကောင်းသည့် အလိုအလျောက် ဘာသာပြန်မှုသည် အင်တာနက်ကုမ္ပဏီကြီးများအတွက် အကြီးမားဆုံး ဦးစားပေးလုပ်ငန်းဖြစ်သည်။ ဖြစ်နိုင်သမျှ လူများစွာကို ဖြစ်နိုင်သလောက် ကျယ်ပြန့်စွာ ကမ္ဘာကြီး နှင့် ဆက်သွယ်နိုင်အောင် ပြုလုပ်ပေးရေး သည် ပရဟိတလုပ်ငန်းဆိုင်ရာ ပန်းတိုင်တစ် ရပ်ဖြစ်ရုံမျှမက ကောင်းမွန်သည့် စီးပွားရေး လုပ်ငန်းဆိုင်ရာ ရည်မှန်းချက်လည်းဖြစ် သည်။

Facebook၊ Google နှင့် Microsoft တို့အပြင် ရုရှားနိုင်ငံ၏ Yandex ၊ တရုတ်နိုင်ငံ၏ Baidu နှင့်အခြား ကုမ္ပဏီများသည်  အလိုအလျောက် ဘာသာပြန်စက်များ တိုးတက်လာစေရေးအတွက် အဆက်မပြတ် ကြိုးပမ်းရှာဖွေနေကြသည်။

Facebook ၏ ပါရီရှိ သုတေသနဓာတ်ခွဲခန်းများအနက် တစ်ခုတွင် ယင်းလုပ်ငန်း ကို လုပ်ကိုင်ရန်အတွက် အလိုအလျောက် အသိဉာဏ် (AI) ဆိုင်ရာ ကျွမ်းကျင်သူများ ရှိသည်။

Facebook တွင် ယခုလက်ရှိ၌ ဘာသာစကားပေါင်း ၂၀၀ အထိ အသုံးပြုနေသည်ဟု လူမှုကွန်ရက်အတွက် အခြေခံ AI သုတေသန ဥရောပတွဲဖက်ညွှန်ကြားရေးမှူး အန်တိုနီဘိုးဒက်က ပြောကြားခဲ့သည်။

အလိုအလျောက် ဘာသာပြန်မှုသည် ယခုလက်ရှိ၌ ကိုင်တွယ်မည့် ဘာသာစကား နှစ်ရပ်လုံးရှိ ထပ်တူကျ စာသားများဆိုင်ရာ များပြားလှသော Database များရှိမှုအပေါ်  အခြေခံနေရသည်။ သို့သော် များစွာသော  ဘာသာစကားတွဲဖက်မှုများအတွက် ယင်းကဲ့သို့သော အပြိုင်စာသားများက လုံလောက်မှု မရှိသေးပေ။

ထို့ကြောင့် သုတေသနပြုသူများသည်  အခြားနည်းလမ်းများကို ရှာဖွေလျက်ရှိကြရာ Facebook က ယခုကဲ့သို့သော နည်းလမ်းတစ်ရပ်ကို ဖွံ့ဖြိုးအောင် ပြုလုပ်လာနိုင်ခဲ့ခြင်းဖြစ်သည်။ ယင်းနည်းလမ်းမှာ စကားလုံးများကို ကိုယ်စားပြုရန်အတွက် ကိန်း ဂဏန်းများကို အသုံးပြုခြင်းဖြစ်သည်။

စကားလုံးအသီးသီးသည် ရာပေါင်း များစွာသော ဒိုင်မေးရှင်းများနှင့်ပတ်သက်သည့် နေရာတစ်ရပ်ထဲ၌ ကြားခံတစ်ရပ် ဖြစ်လာသည်။ အပြောဘာသာစကား၌ အနီးကပ်ဆက်နွယ်မှုရှိသော စကားလုံးများ သည်လည်း ယင်းကြားခံနေရာအတွင်း၌ ၎င်းတို့အချင်းချင်း အနီးကပ်ဆက်သွယ်ချက် ကို ၎င်းတို့ဘာသာ ရှာဖွေနိုင်ကြသည်။

Basque မှသည် Amazonian သို့

ဥပမာအားဖြင့် cat နှင့် dog ဟူသည့်  စကားလုံးများအား ၀ါကျအတွင်း အဓိပ္ပာယ် ရင်းမြစ်အဖြစ် ယူလိုက်ပါက ယင်းစကားလုံး များသည် တူညီသော အရာတစ်ခုကို ဖော်ပြလျက်ရှိကြောင်းနှင့် ယင်းကဲ့သို့ ဖြစ်ရခြင်းမှာ ၎င်းတို့သည် ရုပ်ပိုင်းဆိုင်ရာအရ အလွန်နီးစပ်ကြသောကြောင့်ဖြစ်ကြောင်း ယခုစနစ် ကို ဒီဇိုင်းရေးဆွဲနေသူတစ်ဦးဖြစ်သည့် ဂွီလာမေလမ်ပယ်က ပြောကြားခဲ့သည်။

“ခင်ဗျားအနေနဲ့ မက်ဒရစ်၊ လန်ဒန်၊ ပါရီဆိုတဲ့ စကားလုံးတွေကို ယူလိုက်ရင် တူညီတဲ့ စိတ်ကူးက ဥရောပမြို့တော်များ ဆိုတာပါပဲ” ဟု ၎င်းက ဆိုသည်။

ထို့နောက် ဘာသာစကားဆိုင်ရာ လမ်းညွှန်မြေပုံများကို အယ်ဂိုရစ်သမ်များ အသုံးပြုလျက် တစ်ခုနှင့်တစ်ခု ချိတ်ဆက်နိုင်သည်။  ပထမဆုံး၌ ယေဘုယျအကျဆုံးဖြစ်ရာမှ တစ်ဆင့်ချင်း ပို၍ပို၍ သန့်စင်ယူသွားရမည့် သဘောဖြစ်သည်။ ဤသို့ဖြင့် အမှားများစွာ မပါတော့ဘဲ ယှဉ်တွဲနိုင်သည့် ပုဒ်စုများ အဖြစ်သို့ရောက်ရှိလာမည်ဖြစ်သည်။ ရလဒ်များအရ အလားအလာကောင်းလျက်ရှိနေပြီဟု လမ်ပယ်က ပြောကြားခဲ့သည်။

အင်္ဂလိပ်-ရိုမေးနီးယား ဘာသာစကား အတွဲအတွက် Facebook ၏ လက်ရှိ ဘာသာပြန်စက်စနစ်သည် စကားလုံး ကြားခံ နယ်စနစ်နှင့် တူညီနိုင်သကဲ့သို့ ယင်းထက် အနည်းငယ်ပိုဆိုး၍လည်း သွားနိုင်သည်ဟု  လမ်ပယ်က ဆိုသည်။

သို့သော် Facebook ၏ လက်ရှိစနစ်၌ ကိုးကားရန် နှစ်ဘာသာတွဲဖက်စာသားများ များများစားစားမရှိသေးသည့် ပိုမိုရှားပါး သော ဘာသာစကားအတွဲဖြစ်သည့် အင်္ဂ လိပ်-အူရဒူအတွက်မူ စကားလုံး ကြားခံနယ် စနစ်သည် အလွန်ကောင်းနေပြီဟု ၎င်းင်းက ဆိုသည်။

သို့သော် Basque မှ အမေဇုံတောထဲရှိ လူမျိုးတစ်မျိုး၏ ဘာသာစကားသို့ ပြန်ဆိုနိုင်သည်အထိပင် ယခု နည်းစနစ်က ဖြစ်နိုင်မည်လားဟု မေးခွန်းထုတ်စရာရှိသည်။

ယင်းနှင့်ပတ်သက်၍ လမ်ပယ်က သဘောတရားအရ ဖြစ်နိုင်သည်ဟု ဖြေဆိုရ မည်ဖြစ်ကြောင်း၊ သို့သော် လက်တွေ့၌ ဘာသာစကားဆိုင်ရာ လမ်းညွှန်မြေပုံရေးဆွဲရန် လိုအပ်သည့် အရေး ဘာသာစကားဆိုင်ရာ စာသားများ အကြီးအကျယ်လိုအပ်မည်ဖြစ်ကြောင်းနှင့် အမေဇုံလူမျိုး၏ ဘာသာစကားများ၌ ယင်းအချက် ချို့တဲ့ကြောင်း ၎င်းက ပြောကြားခဲ့သည်။

“ခင်ဗျားဆီမှာ သောင်းနဲ့ချီတဲ့ စကားစု တွေလောက်ပဲ ရှိမယ်ဆိုရင် အလုပ်မဖြစ် ဘူး။ သိန်းပေါင်းများစွာသော စကားစုတွေ လိုအပ်တယ်” ဟု ၎င်းက ဆိုသည်။

 

Holy Grail သို့မဟုတ် လျှို့ဝှက်ဆန်းကြယ်မှု

ပြင်သစ်နိုင်ငံ၏ အမျိုးသားသိပ္ပံဌာန (CNRS) မှ ကျွမ်းကျင်သူများက လမ်ပယ်တို့ Facebook အတွက် ပြုလုပ်နေသည့် ချဉ်းကပ်ပုံသည် ပြီးပြည့်စုံသည့် ဘာသာပြန်မှုရလဒ်မျိုး ရရှိမလာသည့်တိုင် အသုံးဝင်သော ရလဒ်များကို ထုတ်လုပ်ပေးနိုင်လိမ့်မည်ဟု ပြောကြားခဲ့သည်။

ဘာသာပြန်စက်အတွက် သုတေသနပြုလုပ်နေသော ဌာနတစ်ခုဖြစ်သည့် CRNS ၏ Lattice ဓာတ်ခွဲခန်းမှ သီယာရီပွိုင်ဗျူးက  Facebook ၏ စကားလုံးကြားခံနယ် ချဉ်းကပ် ပုံနည်းလမ်းကို စိတ်ကူးဆိုင်ရာ တော်လှန် ရေးတစ်ရပ်ဟု ခေါ်ဆိုခဲ့သည်။

“အဘိဓာန် ဒါမှမဟုတ် ဘာသာစကား နှစ်ရပ်စလုံးက တူညီတဲ့ စာသားအထောက်အထား ဗားရှင်းတွေလိုမျိုး အပြိုင်အချက် အလက်မပါဘဲ ဘာသာပြန်ခြင်းဟာ ဘာသာပြန်စက်နဲ့ပတ်သက်တဲ့ Holy Grail ပါပဲ”  ဟု ၎င်းက ပြောကြားခဲ့သည်။

အလယ်ခေတ် ဒဏ္ဍာရီတစ်ခုအရ နောက်ဆုံးညစာ၌ ခရစ်တော်အသုံးပြုသည့်  ခွက် သို့မဟုတ် ပန်းကန်ကို Holy Grail ဟု ခေါ်ဆိုပြီး ယင်းပန်းကန်ကို ရှာပုံတော်ဖွင့်မှု သည် ၁၃ ရာစုအစောပိုင်းမှစ၍ ဒဏ္ဍာရီ ပုံပြင်များထဲ၌ လျှို့ဝှက်ဆန်းကြယ်မှုတစ်ရပ် အဖြစ် ပါဝင်ခဲ့သည်။

“စကားလုံး ကြားခံနယ် စနစ်မှနေ၍ စွမ်းဆောင်နိုင်မှုအဆင့်ကိုသာ မျှော်လင့်နိုင် ခြင်းက မေးခွန်းထုတ်ဖွယ်ဖြစ်ကြောင်း” ပွိုင်ဗျူးက ပြောကြားခဲ့သည်။

ယင်းနည်းလမ်းသည် မူရင်းစာသား များနှင့်ပတ်သက်၍ စိတ်ကူးတစ်ရပ်ကို ပေး နိုင်သော်လည်း အခါတိုင်း၌ ကောင်းမွန် သည့် ဘာသာပြန်ဆိုမှုဖြစ်ရန်ကိုမူ အာမ,မခံနိုင်သေးပေ။

CNRS ၏ မက္ကင်းနစ်နှင့် အင်ဂျင်နီယာ သိပ္ပံဆိုင်ရာ ကွန်ပျူတာသိပ္ပံဓာတ်ခွဲခန်းမှ သုတေသနပြုသူ ဖရန်ဆွာယွန်းက ဘာသာစကားများ၏ ဆက်နွှယ်မှုသည် ၎င်းတို့အား တစ်ခုနှင့်တစ်ခု ခွဲထုတ်လိုက်သည့်အခါ များစွာပို၍ ခက်ခဲသွားတတ်ကြောင်း ပြောကြားခဲ့သည်။

 

 

Most Read

Most Recent