উন্নয়নশীল বিশ্বে কৃত্রিম বুদ্ধিমত্তা—১২ || ড. আনিস রহমান
স্বল্প—সম্পদ ভাষা ও ডিজিটাল অন্তর্ভুক্তি: কৃত্রিম বুদ্ধিমত্তার মাধ্যমে ভাষাগত বৈষম্য দূরীকরণ
৬. তথ্যের অপ্রতুলতা দূরীকরণে সিন্থেটিক ডেটা ও ক্রাউডসোর্সিং
স্বল্প—সম্পদ ভাষার প্রধান সীমাবদ্ধতা হলো ডেটার অভাব। এই অভাব পূরণে গবেষকরা এখন কেবল প্রাকৃতিক তথ্যের ওপর নির্ভর না করে সিন্থেটিক ডেটা তৈরির দিকে মনোযোগ দিচ্ছেন। সিন্থেটিক ডেটা হলো কৃত্রিমভাবে তৈরি তথ্য যা একটি শক্তিশালী এআই মডেল ব্যবহার করে অন্য একটি মডেলের প্রশিক্ষণের জন্য তৈরি করা হয়। যেমন ইংরেজিতে থাকা লক্ষ লক্ষ চিকিৎসাবিজ্ঞান সংক্রান্ত তথ্যকে উন্নত অনুবাদ ব্যবস্থার মাধ্যমে বাংলায় রূপান্তর করে একটি বিশাল বাংলা মেডিকেল ডেটাসেট তৈরি করা সম্ভব। এছাড়া ‘ব্যাক—ট্রান্সলেশন’ পদ্ধতির মাধ্যমে একটি বাক্যকে প্রথমে টার্গেট ভাষায় অনুবাদ করা হয় এবং পুনরায় সেই বাক্যকে সোর্স ভাষায় ফিরিয়ে আনা হয়। যদি অর্থের পরিবর্তন না ঘটে, তবে সেই ডেটাটি প্রশিক্ষণ সেটে যুক্ত করা হয়।
ডেটা সংগ্রহের আর একটি গুরুত্বপূর্ণ মাধ্যম হলো ক্রাউডসোর্সিং বা জনবল ব্যবহার করে তথ্য সংগ্রহ। মজিলা কমন ভয়েসের মতো বিশ্বব্যাপী স্বীকৃত প্ল্যাটফর্মে সাধারণ মানুষ স্বেচ্ছায় তাদের কণ্ঠস্বর রেকর্ড করে এবং অন্যের রেকর্ড করা অডিও যাচাই করে। বাংলা কমন ভয়েস প্রকল্পে এ পর্যন্ত শত শত ঘণ্টার অডিও ডেটা সংগ্রহ করা হয়েছে যা বাংলা স্পিচ—টু—টেক্সট মডেল তৈরির জন্য একটি অমূল্য সম্পদ। বাংলাদেশে ‘বাঙালি এআই’ নামক অলাভজনক সংস্থাগুলো এআই গবেষণাকে সর্বজনীন করার জন্য কাজ করছে। তারা নিয়মিতভাবে বিভিন্ন প্রতিযোগিতার আয়োজন করে যার মাধ্যমে হাতের লেখা চেনার ডেটা, আঞ্চলিক ভাষার অডিও ডেটা এবং ব্যাকরণগত ভুল শনাক্ত করার ডেটাসেট তৈরি করা হচ্ছে। এই ধরনের উদ্যোগগুলো প্রমাণ করে যে সরকারি ও বেসরকারি যৌথ প্রচেষ্টার মাধ্যমে স্বল্প—সম্পদ ভাষার বাধা অতিক্রম করা সম্ভব।
৭. ক্ষুদ্র জাতিসত্তার ভাষা এবং ডিজিটাল সুরক্ষা: একটি মানবিক চ্যালেঞ্জ
বাংলাদেশে বসবাসরত ক্ষুদ্র জাতিসত্তার মানুষরা প্রায়ই প্রযুক্তির সুবিধা থেকে সবচেয়ে বেশি বঞ্চিত হয়। চাকমা, মারমা, গারো, ত্রিপুরা এবং সাঁওতালি ভাষাগুলো বিলুপ্তির ঝুঁকিতে রয়েছে। কারণ এই ভাষাগুলোর ডিজিটাল উপস্থিতি প্রায় নেই বললেই চলে। এই সংকটের সমাধানে বিভিন্ন গবেষণামূলক প্রজেক্ট এক যুগান্তকারী পদক্ষেপ হিসেবে আবির্ভূত হয়েছে। এই প্রজেক্টগুলোতে চাকমা বা মারমা ভাষার বাক্যগুলোকে বাংলা লিপিতে প্রতিবর্ণীকরণ করা হয়েছে এবং সেগুলোর প্রমিত বাংলা ও ইংরেজি অনুবাদ প্রদান করা হয়েছে। যদিও সংখ্যার দিক থেকে এই ডেটাগুলো কম মনে হতে পারে, কিন্তু স্বল্প—সম্পদ ভাষার গবেষণায় এটি একটি বিশাল ভিত্তি।
ক্ষুদ্র জাতিসত্তার মানুষরা যখন সামাজিক যোগাযোগ মাধ্যমে তাদের নিজের ভাষায় লেখেন, তখন তারা প্রায়ই বাংলা লিপি ব্যবহার করেন। তাই এই প্রতিবর্ণীকরণ প্রক্রিয়াটি তাদের ডিজিটাল অন্তর্ভুক্তিতে অত্যন্ত কার্যকর। বিভিন্ন প্রজেক্ট লোককাহিনী, মৌখিক বর্ণনা এবং ঐতিহ্যবাহী গান থেকে তথ্য সংগ্রহ করে হাজার হাজার সারিবদ্ধ বাক্য তৈরি করেছে। এই প্রজেক্টগুলোর একটি মানবিক দিক হলো এটি সরাসরি জাতিসত্তার মানুষের অংশগ্রহণে পরিচালিত হয়। এর ফলে শব্দের সঠিক উচ্চারণ এবং সাংস্কৃতিক ভাবধারা সংরক্ষিত থাকে। যখন একজন চাকমা শিশু তার নিজের ভাষায় অনলাইন ক্লাসের সুযোগ পাবে বা কোনো বৃদ্ধ তার নিজের ভাষায় চিকিৎসকের নির্দেশাবলী শুনতে পারবে, তখনই ডিজিটাল অন্তর্ভুক্তির প্রকৃত সাফল্য আসবে। সরকার বর্তমানে প্রতিটি ক্ষুদ্র জাতিসত্তার ভাষা সংরক্ষণের জন্য হাজার হাজার মৌখিক মিনিট সংগ্রহের কাজ শুরু করেছে যাতে তাদের ভাষাকে সাইবার স্পেসে বাঁচিয়ে রাখা যায়।
৮. ভয়েস—ভিত্তিক এআই ও ডিজিটাল সাক্ষরতার বিকল্প সমাধান
বাংলাদেশের প্রেক্ষাপটে একটি বড় চ্যালেঞ্জ হলো ডিজিটাল সাক্ষরতার অভাব। অনেক মানুষ স্মার্টফোন বা অ্যাপ ব্যবহার করতে স্বাচ্ছন্দ্য বোধ করেন না। এই সমস্যা সমাধানের জন্য ভয়েস—ভিত্তিক এআই বা কথোপকথনমূলক ইঞ্জিন এক বৈপ্লবিক সমাধান হিসেবে আবির্ভূত হয়েছে। এই ভয়েস সার্ভিসগুলো ইন্টারনেটের প্রয়োজন ছাড়াই যেকোনো সাধারণ বা ফিচার ফোন থেকে ব্যবহার করা যায়। ব্যবহারকারীকে কেবল ফোনে কথা বলতে হয় এবং এআই তার কথা শুনে যথাযথ উত্তর বা সেবা প্রদান করে। এটি মাইক্রোফাইনান্স সেক্টরের কোটি কোটি গ্রাহককে লেনদেনের তথ্য জানতে সাহায্য করছে।
ভয়েস—ভিত্তিক এআই ব্যবহারের ফলে একজন নিরক্ষর মানুষও ব্যাংকিং সুবিধা নিতে পারছেন। তিনি ফোনের ওপাশে থাকা এআই—কে তার ব্যালেন্স সম্পর্কে জিজ্ঞেস করতে পারেন এবং এআই তৎক্ষণাৎ তার ভয়েস চিনে সঠিক তথ্য জানিয়ে দেয়। এর ফলে মানুষকে প্রযুক্তির ব্যবহার শেখার প্রয়োজন হচ্ছে না, বরং প্রযুক্তি মানুষের ব্যবহারের উপযোগী হয়ে উঠছে। স্পিচ প্রযুক্তির আধুনিকায়নে এমন সব ফ্রেমওয়ার্ক তৈরি হচ্ছে যা খুব অল্প ডেটা ব্যবহার করে একজন স্পিকারের কণ্ঠস্বর নকল করে কথা বলতে পারে। এটি দৃষ্টিপ্রতিবন্ধী ব্যক্তিদের জন্য বই পড়ে শোনানো বা সংবাদ পাঠ করার কাজে ব্যবহার করা যেতে পারে। এভাবে ভয়েস টেকনোলজি ডিজিটাল ডিভাইড দূর করতে একটি জাদুর কাঠির মতো কাজ করছে।
৯. এনএলপি গবেষণার ভবিষ্যৎ এবং সামাজিক প্রভাব
বাংলা ও আঞ্চলিক ভাষার এনএলপি গবেষণা এখন আর কেবল অনুবাদ বা টাইপিংয়ের মধ্যে সীমাবদ্ধ নেই। সেন্টিমেন্ট অ্যানালাইসিস বা মানুষের আবেগ বোঝার প্রযুক্তিও এখন আঞ্চলিক ভাষায় কাজ করছে। গবেষকরা এখন এমন হাইব্রিড মডেল ব্যবহার করছেন যা চাটগাঁইয়া বা সিলেটের ভাষার আবেগ শনাক্তকরণে বেশ নির্ভুল ফলাফল দিচ্ছে। এছাড়া মাল্টিমোডেল এআই ব্যবহারের সম্ভাবনা বাড়ছে। এটি এমন এক প্রযুক্তি যা একই সাথে টেক্সট, অডিও এবং ছবি প্রসেস করতে পারে। গ্রামীণ মানুষের জন্য এটি অত্যন্ত কার্যকরী হতে পারে, যেখানে একজন মানুষ কোনো সরকারি ফরমের ছবি তুলে সেটি এআই—এর কাছে পাঠাতে পারেন এবং এআই তাকে তার নিজের ভাষায় বুঝিয়ে দিতে পারে ফরমটি কীভাবে পূরণ করতে হবে।
ভবিষ্যৎ এনএলপি প্রযুক্তিতে নৈতিকতা ও স্বচ্ছতার ওপরও জোর দেওয়া হচ্ছে। কৃত্রিম বুদ্ধিমত্তার নৈতিক ব্যবহার এবং মানবাধিকার সুরক্ষার গাইডলাইন প্রণয়ন করা হচ্ছে। ডেটা প্রাইভেসি এবং সাইবার নিরাপত্তা নিশ্চিত করে যদি এআই প্রযুক্তিতে বাংলার উপভাষা এবং ক্ষুদ্র জাতিসত্তার ভাষাগুলোকে অন্তর্ভুক্ত করা যায়, তবেই একটি বৈষম্যহীন ডিজিটাল সমাজ গড়া সম্ভব হবে। প্রযুক্তির লক্ষ্য হওয়া উচিত এমন এক পৃথিবী গড়ে তোলা যেখানে কোনো মানুষ তার ভাষার কারণে বৈষম্যের শিকার হবে না এবং ইন্টারনেটের দুনিয়ায় প্রতিটি স্বর সমানভাবে শ্রুত হবে।
বাংলা এবং এর আঞ্চলিক উপভাষাগুলোর জন্য ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (ঘখচ) গবেষণার বর্তমান গতিপথ নির্দেশ করছে যে, আমরা কেবল তথ্যের অনুবাদের যুগ পার করছি না, বরং এমন এক ডিজিটাল বাস্তুসংস্থান তৈরি করছি যেখানে কৃত্রিম বুদ্ধিমত্তা মানুষের সাংস্কৃতিক ও আবেগীয় সূক্ষ¥তা উপলব্ধি করতে সক্ষম।
