আধুনিক প্রযুক্তিতে উন্মোচিত হচ্ছে পাণ্ডুলিপির মুছে যাওয়া ইতিহাস

১২২৯ সালে ধর্মযাজক জোহানেস মাইরোনাস তার প্রার্থনা লেখার জন্য ৩০০ বছরের পুরনো একটি পার্চমেন্ট ব্যবহার করেন। পার্চমেন্টটি আগে থেকেই গ্রিক ভাষায় লেখা অজানা সব সূত্রে পূর্ণ ছিল, যার কোনো অর্থই তার জানা ছিল না।
সেই সময় লেখার যেকোনো উপকরণ ছিল দুষ্প্রাপ্য। তাই তিনি পুরোনো লেখাগুলো মুছে পাতাগুলো কেটে ভাঁজ করে প্রার্থনার খাতা বানিয়ে ফেলেন।
২০০০ সালে যুক্তরাষ্ট্রের বাল্টিমোরে ওয়ালটার্স আর্ট মিউজিয়ামের ৮০ জনের বেশি বিশেষজ্ঞের একটি দল এই প্রাচীন প্যালিম্পসেস্ট, অর্থাৎ মুছে ফেলা লেখার চিহ্নযুক্ত পাণ্ডুলিপি, পড়ার চেষ্টা করেন। পাঁচ বছরের চেষ্টায় তারা আবিষ্কার করেন, এটি ছিল গণিতবিদ আর্কিমিডিসের রচনাসমগ্র। যার মধ্যে ছিল দ্য মেথড অব মেকানিক্যাল থিওরেমস, যা ধ্রুপদী ও আধুনিক গণিতের জন্য অত্যন্ত গুরুত্বপূর্ণ।
সম্প্রতি স্পেনের একটি গবেষণায় কৃত্রিম বুদ্ধিমত্তা (এআই) ব্যবহার করে এ ধরনের পাণ্ডুলিপি পড়ার একটি পদ্ধতি উদ্ভাবনের কথা জানানো হয়েছে। গবেষণাটি প্রকাশিত হয়েছে পিয়ার-রিভিউড জার্নাল ম্যাথমেটিকস-এ।
এর ফলে গোপন বা বিকৃত লেখার পাঠোদ্ধারে গবেষকদের আগে যে বিপুল পরিশ্রম হতো, তা অনেকটাই কমে যাবে। তবে
এ ধরনের চর্চার প্রভাব শুধু বিজ্ঞানে নয়, ধর্মগ্রন্থ ও চিকিৎসা-বিষয়ক গ্রন্থেও পড়েছে।
ভ্যাটিকান লাইব্রেরিতে একটি গ্রন্থ রয়েছে, যেখানে একজন খ্রিস্টান ধর্মতাত্ত্বিক ১,৫০০ বছরেরও পুরোনো বাইবেলের কিছু অংশের লেখা মুছে তার ওপর নিজের লেখা লিখেছেন।
একাধিক গ্রিক চিকিৎসা বিষয়ক পাণ্ডুলিপি বিশ্লেষণ করেও দেখা গেছে, এগুলোর আগের লেখা মুছে তার ওপর বাইজানটাইন প্রার্থনা লেখা হয়েছিল।
তবে মুছে ফেলা লেখাগুলো উদ্ধারের প্রক্রিয়া এতটা জটিল না হলে, এই তালিকা আরও দীর্ঘ হতো নিশ্চয়ই।
গবেষণাপত্রের লেখক হোসে লুইস সালমেরন ও ইভা ফার্নান্দেজ পালোপ জানান, প্যালিম্পসেস্টে থাকা লেখাগুলোতে যান্ত্রিক ও রাসায়নিক ক্ষয় থাকে, যা মাল্টিস্পেকট্রাল ইমেজিং, এক্স-রে, টোমোগ্রাফির মতো প্রযুক্তির সাহায্য ছাড়া দেখা যায় না। কিন্তু এসব প্রযুক্তিও পুরোপুরি কার্যকর নয়।
তাদের তৈরি নতুন এআই মডেল কৃত্রিম ডেটা ব্যবহার করে লেখার ক্ষয়প্রক্রিয়া নিরূপণ করে এবং প্রচলিত প্রযুক্তির চেয়ে ভালো ফল দেয়। এই মডেল সাধারণ ডিজিটাল ছবির মাধ্যমেও কাজ করে।
সালমেরন জানান, এই গবেষণার ভাবনা আসে ইভা পালোপের একটি প্রস্তাব থেকে। তিনি প্যালিম্পসেস্ট নিয়ে থিসিস করছিলেন এবং এজন্য নতুন কম্পিউটার প্রযুক্তি প্রয়োগের কথা ভাবছিলেন।
তিনি বলেন, 'আমাদের সিস্টেমের সুবিধা হলো আমরা ক্ষয়প্রক্রিয়া, রঙ, ভাষা ইত্যাদি প্রতিটি দিক নিয়ন্ত্রণ করতে পারি, যার ফলে আমরা সব সম্ভাবনা বিবেচনায় নিয়ে একটি নির্দিষ্ট ডেটাবেস তৈরি করতে পারি।'
তারা সিরিয়াক, ককেশীয়, আলবেনীয় ও ল্যাটিন ভাষার পাণ্ডুলিপিতে কাজ করেছেন এবং ক্লাসিক পদ্ধতির চেয়ে ভালো ফল পেয়েছেন বলে জানান।
এই কাজ করতে গিয়ে তারা এমন একটি অ্যালগরিদম তৈরি করেছেন, যে কোনো গবেষক যা ব্যবহার করতে পারেন।
তবে এই উদ্ভাবন শুধুই ঐতিহাসিক দলিলের মধ্যে সীমাবদ্ধ নয়।
সালমেরন বলেন, 'অগোছালো, আংশিক দৃশ্যমান বা ওভারল্যাপিং তথ্য থাকা সব ক্ষেত্রেই এই দ্বৈত-নেটওয়ার্ক কাঠামো বিশেষভাবে উপযোগী।'
চিকিৎসা চিত্র বিশ্লেষণ, রিমোট সেন্সিং, জীববৈজ্ঞানিক মাইক্রোস্কপি, শিল্প পরিদর্শন এবং ফরেনসিক তদন্তে এই ধরনের ঘটনা দেখা যায়।
এই কম্পিউটার প্রযুক্তির প্রয়োগ সাইবার নিরাপত্তা এবং কৃত্রিম বুদ্ধিমত্তার জন্য বৃহৎ ভাষা মডেল তৈরির ক্ষেত্রেও গুরুত্বপূর্ণ।
সালমেরন ব্যাখ্যা করেন, 'বিভিন্ন প্রতিষ্ঠান এখন ঝুঁকি ছাড়াই সংবেদনশীল তথ্যের উন্নত মানের ডেটাসেট তৈরি করতে পারে, যা দিয়ে মেশিন লার্নিং মডেল প্রশিক্ষণ দেওয়া, সমাধান পরীক্ষায় ব্যবহার বা এই ধরনের নানা কাজ সম্ভব। আপনি যদি স্বাস্থ্য সেবা রেকর্ড, আর্থিক লেনদেন, গ্রাহক আচরণ বা যেকোনো সংবেদনশীল টেবুলার ডেটা নিয়ে কাজ করেন, এসব কাজের জন্য এটি একটি যুগান্তকারী আবিষ্কার।'
তবে গবেষকেরা স্বীকার করেছেন, তাদের পদ্ধতির কিছু সীমাবদ্ধতা রয়েছে। তারা লিখেছেন, অতি ক্ষয়প্রাপ্ত লেখায় মডেলটির কার্যকারিতা কমে যায়।পাশাপাশি, প্রশিক্ষণের সময় লেখার ধরনে ভারসাম্য না থাকলে ডিপ লার্নিং সিস্টেম প্রভাবিত হতে পারে।'
তবে গবেষকরা জানান, এই সীমাবদ্ধতাগুলোর তাদের আরও বেশি গবেষণার উৎসাহ দিচ্ছে। শুধু প্রতিবন্ধকতাগুলো অতিক্রম করার জন্যই নয়, বরং এই শিক্ষাগুলোকে অন্য ক্ষেত্রেও প্রয়োগ করতেও তারা আগ্রহী।