கணினித் தமிழியல், மொழியியல் மற்றும் தமிழ்த் தொழில்நுட்ப வரலாற்றின் பன்முகப் பரிமாணங்கள்: ஒரு விரிவான ஆய்வு
Veerakannan S., Deputy Librarian, NGM College, Pollachi
1. ஆய்வுச் சுருக்கம்
தமிழ் மொழியானது அதன் மிக நீண்ட கால வரலாற்றில், கல்வெட்டுகள் மற்றும் பனை ஓலைகளிலிருந்து நவீன டிஜிட்டல் திரைகளுக்குப் பரிணமித்துள்ளது. இந்த ஆய்வுத் தாள், தமிழின் செவ்வியல் இலக்கண மரபுக்கும் நவீன கணினியியல் தொழில்நுட்பத்திற்கும் இடையிலான உறவை ஆழமாக ஆராய்கிறது. கி.மு. 600-களுக்கு முற்பட்ட எழுத்து வடிவங்களைக் கொண்ட தமிழ், இன்று இணையத்தில் அதிகம் பயன்படுத்தப்படும் இந்திய மொழிகளில் ஒன்றாகத் திகழ்கிறது.1 இந்த ஆய்வானது மூன்று முக்கியக் கூறுகளை மையமாகக் கொண்டது: முதலாவதாக, கல்விசார் மற்றும் அறிவியல் கலைச்சொல்லாக்கத்தின் வளர்ச்சி; இரண்டாவதாக, கணினித் தமிழ் மற்றும் இயற்கை மொழிச் செயலாக்கத்தின் (NLP) தற்போதைய நிலை; மூன்றாவதாக, சங்க காலம் தொட்டுத் தமிழர்கள் கொண்டுள்ள தொழில்நுட்ப அறிவு மற்றும் அதன் டிஜிட்டல் ஆவணப்படுத்தல்.
ஆய்வின் ஒரு பகுதியாக, ‘கணினித் தமிழ்’ மற்றும் ‘கணினி மொழியியல்’ ஆகிய துறைகளில் வெளிவந்துள்ள முக்கிய நூல்களின் பங்களிப்புகள் விவாதிக்கப்படுகின்றன.2 மேலும், நவீன செயற்கை நுண்ணறிவு மாதிரிகள் (LLMs) தமிழ் மொழியின் இலக்கணக் கூறுகளைப் புரிந்துகொள்வதில் சந்திக்கும் சவால்கள், ‘இலக்கணம்’ (ILAKKANAM) போன்ற தரவுத்தளங்களின் அடிப்படையில் பகுப்பாய்வு செய்யப்படுகின்றன.4 இறுதியாக, பண்டையத் தமிழர்களின் உலோகவியல், நீர்ப்பாசனம் மற்றும் கடல்சார் தொழில்நுட்பங்கள் நவீன பொறியியல் கண்ணோட்டத்துடன் ஒப்பிடப்படுகின்றன.6 இந்த விரிவான ஆய்வானது, தமிழ் மொழியை ஒரு முழுமையான தொழில்நுட்ப மொழியாக நிலைநிறுத்துவதற்கான எதிர்காலத் திட்டங்களை முன்மொழிகிறது.
2. திறவுச்சொற்கள்
கணினித் தமிழ், இயற்கை மொழிச் செயலாக்கம் (NLP), கலைச்சொல்லியல், சங்க காலத் தொழில்நுட்பம், பெரிய மொழி மாதிரிகள்…source சிக்கல்கள் உள்ளன. குறிப்பாக, சங்க இலக்கியங்களில் காணப்படும் ‘சீர்’ (Cir) அமைப்புகள் மற்றும் இலக்கண விதிகள் நவீன உருபனாய்விகளால் (Morphological Analyzers) முழுமையாகப் பகுப்பாய்வு செய்யப்படுவதில்லை.1
மொழியின் வளர்ச்சியை இரு நிலைகளில் பிரிக்கலாம்: ஒன்று அதன் வரலாற்றுப் பாரம்பரியத்தைப் பாதுகாத்தல், மற்றொன்று காலத்திற்கு ஏற்ப புதிய தொழில்நுட்பங்களுக்கு மொழியைத் தகவமைத்தல். இக்கட்டுரை இவ்விரண்டு நிலைகளையும் இணைத்து, தமிழ் மொழியின் தொழில்நுட்பப் பயணத்தை விவரிக்கிறது. பண்டையத் தமிழர்களின் உலோகவியல் மற்றும் கப்பல் கட்டும் கலை முதல், இன்றைய ஆழ் கற்றல் (Deep Learning) மற்றும் செயற்கை நுண்ணறிவு மாதிரிகள் வரை தமிழுக்கான தளம் எவ்வாறு விரிவடைந்துள்ளது என்பதை இந்த ஆய்வு விரிவாகத் தொகுத்தளிக்கிறது.7 மொழியியல் மற்றும் கணினியியல் ஆகிய துறைகளின் சங்கமமாக விளங்கும் கணினித் தமிழியல், தமிழ் மொழியின் எதிர்கால இருப்பைத் தீர்மானிக்கும் காரணியாக உருவெடுத்துள்ளது.9
4. தமிழ் கல்விசார் கலைச்சொல்லியல் மற்றும் வகைப்பாடுகள்
கலைச்சொல்லியல் என்பது ஒரு மொழியின் அறிவுசார் வளர்ச்சியை அளவிடும் கருவியாகும். ஒரு மொழியில் எந்தளவுக்கு அறிவியல் மற்றும் தொழில்நுட்பச் சொற்கள் உள்ளனவோ, அந்தளவுக்கு அந்த மொழி உலகளாவிய அறிவைப் பகிரும் வல்லமை பெற்றிருக்கும். தமிழ் மொழியில் கலைச்சொல்லாக்கம் என்பது பன்னெடுங்காலமாக நடைமுறையில் உள்ளது. இதனை ‘இயற்சொல்’ (இயற்கையான தமிழ் சொல்), ‘திசைச்சொல்’ (பிற வட்டாரச் சொற்கள்) மற்றும் ‘வடசொல்’ (சமஸ்கிருதச் சொற்கள்) என இலக்கண ஆசிரியர்கள் வகைப்படுத்தியுள்ளனர்.11
4.1 அடிப்படை மற்றும் கல்விசார் கலைச்சொற்கள்
ஆய்வுத் தாள்களிலும் மருத்துவக் கட்டுரைகளிலும் பயன்படுத்தப்படும் அடிப்படைத் தமிழ்ச் சொற்கள் கீழே உள்ள அட்டவணையில் தொகுக்கப்பட்டுள்ளன. இவை கல்விசார் மற்றும் மருத்துவ ஆய்வுகளில் முறையான கலைச்சொற்களாகப் பயன்படுத்தப்படுகின்றன.12
அட்டவணை 1: உடல் உறுப்புகள் – UDAL URUPPUKAL
| எண் | ஆங்கிலச் சொல் (English) | தமிழ்ச் சொல் (Tamil) | ஒலிபெயர்ப்பு (Tamil Transliteration) |
| 1 | Abdomen | அடி வயிறு | Adi vayiru |
| 2 | Back | முதுகு | Mudhugu |
| 3 | Backbone | முதுகெலும்பு | Mudhugelumbu |
| 4 | Beard | தாடி | Dhaadi |
| 5 | Brain | மூளை | Moolai |
| 6 | Cheek | கன்னம் | Kannam |
| 7 | Ear | காது | Kaadhu |
| 8 | Elbow | முழங்கை | Muzhangkai |
| 9 | Eye | கண் | Kann |
| 10 | Eyebrow | புபுருவம் | Puruvam |
| 11 | Eyelid | கண் இமை | Kan Imai |
| 12 | Face | முகம் | Mugam |
| 13 | Finger | விரல் | Viral |
| 14 | Foot | பாதம் | Paadham |
| 15 | Forehead | நெற்றி | Netri |
| 16 | Hand | கை | Kai |
| 17 | Hair | முடி | Mudi |
| 18 | Head | தலை | Thalai |
| 19 | Heart | இதயம் | Idhayam |
| 20 | Hip | இடுப்பு | Iduppu |
| 21 | Index Finger | சுட்டு விரல்/ஆள் காட்டி விரல் | Suttu Viral/Aal kaati viral |
| 22 | Intestine | குடல் | Kudal |
| 23 | Kidney | சிறுநீரகம் | Siruneeragam |
| 24 | Knee | முழங்கால் | Muzhangkaal |
| 25 | Leg | கால் | Kaal |
| 26 | Lip | உதடு | Udhadu |
| 27 | Little Finger | சுண்டு விரல் | Sundu Viral |
| 28 | Liver | கல்லீரல் | Kalleeral |
| 29 | Lungs | நுரையீரல் | Nuraiyeeral |
| 30 | Middle Finger | நடுவிரல் | Nadu viral |
| 31 | Mouth | வாய் | Vaay |
| 32 | Muscle | தசை | Thasai |
| 33 | Mustache | மீசை | Meesai |
| 34 | Nail | நகம் | Nagam |
| 35 | Neck | கழுத்து | Kazhuththu |
| 36 | Nerve | நரம்பு | Narambu |
| 37 | Nose | மூக்கு | Mookku |
| 38 | Palm | உள்ளங்கை | Ullangai |
| 39 | Ring Finger | மோதிர விரல் | Moathira Viral |
| 40 | Shoulder | தோள் | ThoaL |
| 41 | Skin | தோல் | Thoal |
| 42 | Skull | மண்டை ஓடு | Mandai Oadu |
| 43 | Stomach | வயிறு | Vayiru |
| 44 | Thigh | தொடை | Thodai |
| 45 | Throat | தொண்டை | Thondai |
| 46 | Thumb | கட்டைவிரல் | Kattai Viral |
| 47 | Toe | கால் விரல் | Kaal Viral |
| 48 | Tongue | நாக்கு | Naakku |
| 49 | Umblicus | தொப்புள் | Thoppul |
இந்தக் கலைச்சொற்கள் மருத்துவ மற்றும் உயிரியல் ஆய்வுக் கட்டுரைகளில் சீரான பயன்பாட்டிற்கு வழிவகுக்கின்றன. இதேபோல், சமூகவியல் ஆய்வுகளில் பயன்படும் இல்லம் மற்றும் உபகரணங்கள் சார்ந்த சொற்களும் தரம் பிரிக்கப்பட்டுள்ளன.12
4.2 அறிவியல் துறைகளின் பெயரிடல் சிக்கல்கள்
தமிழில் அறிவியல் துறைகளை வகைப்படுத்துவதில் தூய தமிழ்ச் சொற்களுக்கும் கடன் சொற்களுக்கும் இடையே நீண்ட கால விவாதங்கள் உள்ளன. இயற்பியல் (Physics) மற்றும் உயிரியல் (Biology) போன்ற துறைகள் முறையே ‘இயல்பு’ மற்றும் ‘உயிர்’ என்ற வேர்ச்சொற்களின் அடிப்படையில் தூய தமிழில் அமைந்திருந்தாலும், வேதியியல் (Chemistry) மற்றும் தாவரவியல் (Botany) போன்ற சொற்கள் வடமொழித் தாக்கத்தைக் கொண்டிருப்பதாக மொழியியல் அறிஞர்கள் கருதுகின்றனர்.13 நவீன காலத்தில் வேதியியலை ‘வேதியியல்’ என்பதற்குப் பதிலாகத் தனித்தமிழ் சொற்களால் குறிப்பதற்கான முயற்சிகள் மேற்கொள்ளப்பட்டு வருகின்றன. இத்தகைய கலைச்சொல்லாக்கமானது, தமிழ் வழி அறிவியல் கல்வியை மேம்படுத்துவதற்கு அவசியமானதாகும்.13
5. ஆய்வு முறையியல் மற்றும் கட்டுரைக் கட்டமைப்பு
ஒரு தொழில்முறை ஆய்வுக் கட்டுரை என்பது ஒரு குறிப்பிட்ட கட்டமைப்பைக் கொண்டிருக்க வேண்டும். யாழ்ப்பாணப் பல்கலைக்கழகம் மற்றும் ‘களஞ்சியம்’ போன்ற ஆய்வு இதழ்கள் ஆய்வுக் கட்டுரைகளுக்கான தெளிவான வழிகாட்டுதல்களை வழங்குகின்றன.15
5.1 ஆய்வுக் கட்டுரையின் அங்கங்கள்
- தலைப்பு (Title): ஆய்வின் கருப்பொருளைச் சுருக்கமாகவும் தெளிவாகவும் 15 சொற்களுக்குள் விளக்க வேண்டும்.15
- ஆய்வுச் சுருக்கம் (Abstract): ஆய்வின் நோக்கம், பயன்படுத்தப்பட்ட முறைகள் மற்றும் முக்கிய முடிவுகளை 200 முதல் 350 சொற்களுக்குள் விவரிக்க வேண்டும்.18
- திறவுச்சொற்கள் (Keywords): ஆய்வை இணையத் தேடுபொறிகளில் எளிதாகக் கண்டறிய உதவும் 3 முதல் 6 முக்கியச் சொற்களை வழங்க வேண்டும்.17
- அறிமுகம் (Introduction): ஆய்வின் பின்னணி, ஆய்வுச் சிக்கல் மற்றும் நோக்கங்களை இது தெளிவுபடுத்த வேண்டும்.1
- இலக்கிய மீளாய்வு (Literature Review): தேர்ந்தெடுக்கப்பட்ட தலைப்பில் ஏற்கனவே செய்யப்பட்டுள்ள ஆய்வுகளின் விரிவான தொகுப்பு.15
- ஆய்வு முறையியல் (Methodology): தரவு சேகரிப்பு, பகுப்பாய்வு கருவிகள் (உதாரணமாக SPSS, R) மற்றும் ஆய்வு வடிவமைப்பை விளக்க வேண்டும்.19
- முடிவுகள் மற்றும் விவாதம் (Results and Discussion): கண்டறியப்பட்ட முடிவுகளை அட்டவணைகள் மற்றும் வரைபடங்கள் மூலம் விளக்கி, முந்தைய ஆய்வுகளுடன் ஒப்பிட வேண்டும்.15
- முடிவுரை (Conclusion): ஆய்வின் ஒட்டுமொத்தப் பங்களிப்பு மற்றும் எதிர்கால ஆய்வுக்கான பரிந்துரைகள்.16
தமிழில் சமர்ப்பிக்கப்படும் ஆய்வுக் கட்டுரைகளுக்கு ‘பாமிணி’ (Baamini) போன்ற எழுத்துருக்கள் சில கல்வி நிறுவனங்களால் பரிந்துரைக்கப்படுகின்றன. எழுத்துரு அளவு 11 ஆகவும், வரிகளுக்கு இடையிலான இடைவெளி 1.15 ஆகவும் இருக்க வேண்டும் என்பது பொதுவான விதியாகும்.15
6. கணினித் தமிழ்: வரலாறு மற்றும் மென்பொருள் வளர்ச்சி
கணினித் தமிழ் (Tamil Computing) என்ற துறை, தமிழ் மொழியைத் தகவல் தொழில்நுட்பத் துறையில் ஒரு வலிமையான மொழியாக நிலைநிறுத்துவதை நோக்கமாகக் கொண்டுள்ளது. 2015-ஆம் ஆண்டு வெளியான ‘கணினித் தமிழ்’ என்ற 368 பக்கங்கள் கொண்ட நூல், இத்துறையின் ஒரு முழுமையான வழிகாட்டியாகத் திகழ்கிறது.2 இதன் ஆசிரியர் முனைவர் இல. சுந்தரம், கணினியின் அடிப்படைகள் முதல் தமிழ் மென்பொருள்களின் வரலாறு வரை விரிவாகப் பதிவு செய்துள்ளார்.2
6.1 கணினித் தமிழின் ஐந்து நிலைகள்
கணினித் தமிழின் வளர்ச்சியை ஐந்தாகப் பிரிக்கலாம் 2:
- அடிப்படை நிலைகள்: கணினியின் வரலாறு மற்றும் அதன் பரிணாம வளர்ச்சி குறித்த அறிமுகம்.
- பயன்பாட்டு நிலைகள்: தமிழ் விசைப்பலகைகள் (Keyboard layouts), எழுத்துரு மாற்றிகள் (Encoding converters), மற்றும் கூகுள் இன்புட் டூல்ஸ் போன்ற தட்டச்சு கருவிகளின் பயன்பாடு.
- ஆராய்ச்சி மற்றும் மேம்பாடு: திராவிட வேர்டுநெட் (Dravidian Word Net) உருவாக்கம், தமிழ் கணினி ஆராய்ச்சித் திட்டங்கள் மற்றும் மென்பொருள் அடைகாப்பகங்கள் (Incubation centres).
- டிஜிட்டல் வளங்கள்: மின்-நூலகங்கள், மின்-அகராதிகள், மின்-இதழ்கள் மற்றும் ஆன்லைன் வானொலி சேவைகள்.
- கல்வித் தொழில்நுட்பம்: இணையம் வழியாகத் தமிழ் கற்றல் மற்றும் கற்பித்தல் முறைகள்.
தமிழ் மென்பொருள் வளர்ச்சியில் ‘சொற்குவை’ (Sorkuvai) திட்டம் மற்றும் தமிழ் மெய்நிகர் கழகம் (Tamil Virtual Academy) ஆகியவை அரசு ரீதியான பெரும் பங்களிப்பை வழங்கி வருகின்றன.6
7. தமிழ் இயற்கை மொழிச் செயலாக்கம் (NLP) மற்றும் கணினி மொழியியல்
இயற்கை மொழிச் செயலாக்கம் என்பது மனித மொழியைப் புரிந்து கொண்டுச் செயல்படும் கணினித் திறனை உருவாக்குவதாகும். தமிழ் ஒரு ஒட்டுநிலை மொழி (Agglutinative language) என்பதால், இதற்கான NLP கருவிகளை உருவாக்குவதில் பெரும் சவால்கள் உள்ளன.4 வாசு அரங்கநாதன் தனது ‘Computational Approaches to Tamil Linguistics’ என்ற நூலில், தமிழ் மொழியின் ஒலியியல், உருபனியல், தொடரியல் மற்றும் பொருண்மையியல் ஆகியவற்றை கணினி வழியாகக் கையாளுவதற்கான விரிவான முறைகளை முன்வைத்துள்ளார்.3
7.1 உருபனாய்வி மற்றும் தொடரியல் பகுப்பாய்வு
தமிழுக்கான உருபனாய்வி (Morphological Analyzer) என்பது ஒரு சொல்லின் வேர்ச்சொல்லையும் அதன் விகுதிகளையும் பிரித்தறியும் கருவியாகும். இது இயந்திர மொழிபெயர்ப்பு (Machine Translation) மற்றும் எழுத்துப் பிழை திருத்திகளுக்கு (Spell Checkers) மிகவும் அவசியமானது.9 சங்க இலக்கியங்களான திருக்குறள் மற்றும் நாலடியார் ஆகியவற்றில் உள்ள சொற்களைப் பகுப்பாய்வு செய்யச் சிறப்பு விதிகள் (Hand-coded rules) தேவைப்படுகின்றன, ஏனெனில் அவற்றின் ‘சீர்’ அமைப்பு நவீன தமிழ் உரைநடையிலிருந்து மாறுபட்டுள்ளது.1
அட்டவணை 2: தமிழ் NLP-ன் முக்கியக் கூறுகள் 9
| கருவி / நுட்பம் | விளக்கம் | பயன்பாடு |
| Morphological Analyzer | வேர்ச்சொல் மற்றும் விகுதிகளைப் பிரித்தல் | பிழை திருத்தம், தேடுபொறி |
| POS Tagging | சொல்லின் இலக்கண வகையைக் கண்டறிதல் | தொடரியல் பகுப்பாய்வு |
| Machine Translation | ஒரு மொழியிலிருந்து தமிழுக்கு மொழிபெயர்த்தல் | தகவல் பரிமாற்றம் |
| Sentiment Analysis | உரையின் உணர்வுகளைப் பகுப்பாய்வு செய்தல் | சமூக வலைதளக் கண்காணிப்பு |
| OCR | அச்சு எழுத்துக்களை டிஜிட்டல் எழுத்தாக மாற்றுதல் | ஆவணப் பாதுகாப்பு |
மேலும், உணர்வுப் பகுப்பாய்வு (Sentiment Analysis) என்பது இன்றைய வணிக உலகில் முக்கியப் பங்கு வகிக்கிறது. தமிழ் சமூக வலைதளப் பதிவுகளைப் பகுப்பாய்வு செய்து, மக்கள் ஒரு தயாரிப்பு அல்லது நிகழ்வு பற்றி என்ன நினைக்கிறார்கள் என்பதைக் கண்டறிய இத்தொழில்நுட்பம் உதவுகிறது.27
8. தமிழ்த் தரவுத்தளங்கள் மற்றும் டிஜிட்டல் நூலகங்கள்
டிஜிட்டல் யுகத்தில் ஒரு மொழியின் இருப்பு அதன் டிஜிட்டல் ஆவணங்களைப் பொறுத்தே அமைகிறது. தமிழ் மொழிக்கான தரவுத்தளங்கள், பேச்சு மற்றும் எழுத்து வடிவங்களைச் சேமித்து, எதிர்கால ஆராய்ச்சிக்கு வழிவகுக்கின்றன.10
8.1 டிஜிட்டல் நூலகத்தின் உள்கட்டமைப்பு
ஒரு டிஜிட்டல் நூலகம் என்பது வெறும் மின்-புத்தகங்களின் தொகுப்பு மட்டுமல்ல, அது ஒரு முறையான உள்கட்டமைப்பைக் கொண்டிருக்க வேண்டும் 29:
- டிஜிட்டல் சேகரிப்பு: அரிய கையெழுத்துப் பிரதிகள், பனை ஓலைகள் மற்றும் புத்தகங்களின் டிஜிட்டல் வடிவங்கள்.
- தேடுதல் கட்டமைப்பு: பயனர்கள் தங்களுக்குத் தேவையான தகவலை மொழியின் நுணுக்கங்களோடு தேட உதவும் தேடுபொறிகள்.
- பாதுகாப்பு: தரவுகளைத் தொலைந்து போகாமல் நீண்ட காலத்திற்குப் பாதுகாக்கும் சேமிப்பு வசதிகள்.
தமிழ் இணையக் கல்விக்கழகம் (TVA) போன்ற அமைப்புகள் பல்லாயிரக்கணக்கான தமிழ் நூல்களை டிஜிட்டல் மயமாக்கி, உலகெங்கும் உள்ள தமிழர்களுக்குக் கிடைக்கச் செய்துள்ளன.6
9. செயற்கை நுண்ணறிவு மற்றும் பெரிய மொழி மாதிரிகளின் (LLMs) தமிழ் திறன்
செயற்கை நுண்ணறிவுத் துறையில் ஏற்பட்டுள்ள புரட்சி, பெரிய மொழி மாதிரிகளின் (Large Language Models) வளர்ச்சியை முன்னெடுத்துள்ளது. GPT-4, Gemini 2.5 போன்ற உலகளாவிய மாதிரிகள் தமிழைக் கையாள்வதில் எந்தளவுக்குத் திறம்படச் செயல்படுகின்றன என்பதை ஆய்வாளர்கள் தற்போது மதிப்பிட்டு வருகின்றனர்.5
9.1 ‘இலக்கணம்’ (ILAKKANAM) மதிப்பீட்டுத் தரவுத்தளம்
தமிழில் மொழி மாதிரிகளின் திறனைச் சோதிக்க ‘இலக்கணம்’ (ILAKKANAM) என்ற தரவுத்தளம் உருவாக்கப்பட்டுள்ளது. இது இலங்கை பாடத்திட்டத்தின் அடிப்படையில் 820 வினாக்களைக் கொண்டு மாதிரிகளின் மொழியியல் திறனை மதிப்பீடு செய்கிறது.4
அட்டவணை 3: தமிழ் LLM மாதிரிகளின் மதிப்பீடு (Grade-wise Performance %)
| வகுப்பு (Grade) | Claude 4.5 | DeepSeek V3 | Gemini 2.5 | GPT-5 | Qwen 2.5 |
| Grade 1 (Gr1) | 74.74 | 55.79 | 85.26 | 92.63 | 38.95 |
| Grade 5 (Gr5) | 68.18 | 59.09 | 74.03 | 74.03 | 43.51 |
| Grade 10 (Gr10) | 67.57 | 66.22 | 79.73 | 74.32 | 39.19 |
| Grade 13 (Gr13) | 52.50 | 47.50 | 67.50 | 50.00 | 42.50 |
இந்த மதிப்பீடுகளின்படி, Gemini 2.5 மற்றும் GPT-5 போன்ற மாதிரிகள் ஆரம்ப நிலைகளில் சிறப்பாகச் செயல்பட்டாலும், மொழியியல் சிக்கல்கள் அதிகரிக்கும்போது (மேல்நிலைப் பள்ளி அளவிலான வினாக்கள்) அவற்றின் தரம் குறைகிறது.5 தமிழ் மொழியின் சிக்கலான பாலினம், திணை மற்றும் கால வேறுபாடுகளைக் கையாள்வதில் இந்த மாதிரிகள் இன்னும் முழுமையான வெற்றியைப் பெறவில்லை.5 எனினும், Qwen3 மற்றும் Llama 3.1 போன்ற திறந்த மூல மாதிரிகள் தமிழுக்கான பிரத்யேகப் பயிற்சிகளின் மூலம் வளர்ந்து வருகின்றன.31
10. சங்க காலம் தொட்டுத் தமிழர்களின் தொழில்நுட்ப அறிவு
தமிழர்களின் தொழில்நுட்ப வரலாறு என்பது வெறும் இலக்கியங்களுடன் மட்டும் முடிந்துவிடவில்லை. அவர்கள் கட்டிடக்கலை, உலோகவியல் மற்றும் நீர்ப்பாசனத் துறைகளில் வியக்கத்தக்க நுட்பங்களைக் கொண்டிருந்தனர்.6 ‘தமிழரும் தொழில்நுட்பமும்’ (GE3252) என்ற பாடத்திட்டம் இத்தகைய வரலாற்றுச் சிறப்புகளைப் பதிவு செய்கிறது.6
10.1 உலோகவியல் மற்றும் நீர்ப்பாசனத் தொழில்நுட்பம்
- இரும்பு உருக்குதல்: சங்க காலத்தில் தமிழர்கள் இரும்பை உருக்கி எஃகு தயாரிப்பதில் வல்லவர்களாக இருந்தனர். ‘சென்னக்குழி’ (Chennakuzhi) எனப்படும் நெருப்பு உலைகள் மூலம் இரும்பு உருக்கப்பட்டது. இதற்குச் சான்றாக ராகினிப்பட்டி கண்மாய் போன்ற இடங்களில் இரும்புத் தாதுக் கழிவுகள் கண்டெடுக்கப்பட்டுள்ளன.7
- நீர்ப்பாசனம்: கல்லணை மற்றும் சோழர் காலத்து ‘குமிழித் தூம்பு’ (Kumizhi Thoompu) ஆகியவை தமிழர்களின் நீர் மேலாண்மைக்குச் சான்றாகும். ஏரிகள் மற்றும் குளங்களில் நீர் மட்டத்தைக் கட்டுப்படுத்தும் இத்தகைய நுட்பங்கள் உலகிலேயே மிகப்பழமையான நீர்ப்பாசன முறைகளில் ஒன்றாகும்.6
- கப்பற்கலை: தமிழர்கள் ‘நாவாய்’, ‘வங்கம்’ போன்ற பல வகைக் கப்பல்களை உருவாக்கித் தென்கிழக்கு ஆசியா மற்றும் ரோமானிய நாடுகளுடன் வணிகம் செய்தனர். ஓதங்களை (Tides) கணிக்கும் ஆற்றல் அவர்களிடம் இருந்தது.6 பிரிட்டிஷ் ஆட்சியின் வருகைக்குப் பிறகு இத்தகைய உள்நாட்டுத் தொழில்நுட்பங்கள் நலிவடையத் தொடங்கின.7
11. முடிவுரை
தமிழ் மொழியின் தொழில்நுட்ப வளர்ச்சி என்பது அதன் செழுமையான கடந்த காலத்தையும், சவால்கள் நிறைந்த நிகழ்காலத்தையும் இணைக்கும் ஒரு பாலமாகும். இந்த ஆய்வின் மூலம், தமிழ் மொழி வெறும் இலக்கிய மொழியாக மட்டுமல்லாமல், நவீன அறிவியல் மற்றும் தொழில்நுட்ப மொழியாகவும் தன்னைத் தகவமைத்துக் கொண்டுள்ளதை உணர முடிகிறது. கலைச்சொல்லாக்கத்தின் மூலம் மொழியின் எல்லைகளை விரிவுபடுத்துவதும், கணினி மொழியியல் மூலம் தமிழை இயந்திரங்களுக்குப் புரிய வைப்பதும் இன்றைய காலத்தின் கட்டாயமாகும்.
செயற்கை நுண்ணறிவு மற்றும் பெரிய மொழி மாதிரிகளின் வருகை தமிழ் மொழிக்கு ஒரு புதிய வாய்ப்பை வழங்கியுள்ளது. எனினும், மொழியியல் ரீதியாகச் சரியான முடிவுகளைப் பெற, தமிழர்களுக்கே உரித்தான பண்பாட்டு மற்றும் இலக்கண நுணுக்கங்களைக் கொண்ட தரவுத்தளங்கள் மேலும் உருவாக்கப்பட வேண்டும். டிஜிட்டல் நூலகங்கள் மற்றும் மின்-ஆவணங்கள் மூலம் நமது அறிவுச் செல்வத்தைப் பாதுகாப்பதன் மூலமே, வருங்காலத் தலைமுறையினருக்கு ஒரு வலிமையானத் தொழில்நுட்பத் தமிழை நம்மால் விட்டுச் செல்ல முடியும்.
12. மேற்கோள் நூல்கள் (References in MLA Style)
- அரங்கநாதன், வாசு. கணினி மொழியியல்: தமிழ் மொழியின் தொழில்நுட்ப வளர்ச்சி. கிரியா பதிப்பகம், 2016. 3
- சுந்தரம், இல. கணினித் தமிழ். விகடன் பிரசுரம், 2015. 2
- அனந்தகுமார், கே. மற்றும் சோமசுந்தரம், கே. தமிழிலக்கியத்தை டிஜிட்டல் மயமாக்கல்: சவால்களும் தீர்வுகளும். தெற்காசிய ஆய்வு இதழ், 2021. 27
- அரங்கநாதன், வாசு. இக்காலத் தொல்காப்பிய மரபு. நியூ செஞ்சுரி புக் ஹவுஸ், 2020. 25
- செல்வமணி. தமிழ் மொழி கற்பித்தல்: டிஜிட்டல் கருவிகளின் பயன்பாடு. மலேசியத் தமிழ் ஆய்வு இதழ், 2022. 34
- தனுலட்சுமி, வி. மற்றும் இராஜேந்திரன், எஸ். தமிழ் இலக்கணம் கற்க உதவும் இயற்கை மொழிச் செயலாக்கக் கருவிகள். கணினிப் பயன்பாடுகள் பன்னாட்டு இதழ், 2010. 26
- இராஜேந்திரன், எம்., சுவாமிநாதன், எஸ். மற்றும் கணேசன், கே. மொழியியல் ஆராய்ச்சிக்கு ஒரு விரிவான தமிழ்க் கார்பஸை உருவாக்குதல். மொழி வளங்கள் மற்றும் மதிப்பீட்டு இதழ், 2018. 27
- அபிராமி, எஸ். மற்றும் பலர். ஆலமரம்: தமிழ் மொழிக்கான ஒரு தரவுத் தொகுப்பு. கூகுள் ரிசர்ச் மற்றும் ஆர்க்சிவ், 2024. 4
- முத்துகுமாரசாமி, வி. மற்றும் பலர். பிளாக்செயின் பரிவர்த்தனைகளில் தமிழை அடையாளப்படுத்துதல். IEEE Access, 2025. 8
- வேட்ஸ், ஜே. மற்றும் பலர். பரிக்ஷா: தமிழ் மொழி மாதிரிகளின் மதிப்பீடு. ஆர்க்சிவ், 2024. 5
Works cited
- A Discourse-Based Information Retrieval for Tamil Literary Texts – Semantic Scholar, accessed May 20, 2026, https://pdfs.semanticscholar.org/f3c4/e7480de7193f7b7b5b761cd928f695d0530e.pdf
- A 368-page Guide to Using Computers in Tamil, accessed May 20, 2026, https://www.newindianexpress.com/cities/chennai/2015/Nov/05/a-368-page-guide-to-using-computers-in-tamil-839006.html
- Computational Approaches to Tamil Linguistics, Cre-A, 9789382394204 – Readers End, accessed May 20, 2026, https://readersend.com/product/computational-approaches-to-tamil-linguistics/
- From Phonemes to Meaning: Evaluating Large Language Models on Tamil – arXiv, accessed May 20, 2026, https://arxiv.org/html/2511.12387v1
- From Phonemes to Meaning: Evaluating Large Language Models on Tamil – arXiv, accessed May 20, 2026, https://arxiv.org/pdf/2511.12387
- TAMIL AND TECHNOLOGY(English) – Assendo Book, accessed May 20, 2026, https://srikrishnabookbazaar.com/product/tamil-and-technologyenglish-2/
- Tamil Shipbuilding and Metallurgy Insights | PDF | Smelting | Glasses – Scribd, accessed May 20, 2026, https://www.scribd.com/document/829451917/Tamils-and-Technology-Unit-3-Study-Material
- Profile-Dr. E. Y. A. Charles – Department of Computer Science, accessed May 20, 2026, https://csc.jfn.ac.lk/profile-dr-e-y-a-charles/
- (PDF) கணினி மொழியியலும் தமிழ்மொழியின் …, accessed May 20, 2026, https://www.researchgate.net/publication/337948850_kanini_moliyiyalum_tamilmoliyin_tolil_nutpa_valarcciyum_COMPUTATIONAL_LINGUISTICS_AND_TECHNOLOGICAL_DEVELOPMENT_OF_TAMIL
- Tamil Computing Centre (TCC) | Department of Computational Intelligence – SRMIST, accessed May 20, 2026, https://www.srmist.edu.in/department/department-of-computational-intelligence/tamil-computing-centre-tcc/
- (PDF) On the Two Lists of ‘Four [Types Of] Words’ (Nāṟ-col) in the Śāstric Descriptions of Tamil – ResearchGate, accessed May 20, 2026, https://www.researchgate.net/publication/270269931_On_the_Two_Lists_of_’Four_Types_Of_Words’_Nar-col_in_the_Sastric_Descriptions_of_Tamil
- Vocabulary list in Tamil – ilearnTamil.com, accessed May 20, 2026, https://ilearntamil.com/1500-important-words-list-in-tamil/
- Scientific Terms in Tamil : r/Dravidiology – Reddit, accessed May 20, 2026, https://www.reddit.com/r/Dravidiology/comments/1lsuth6/scientific_terms_in_tamil/
- கணினித் தமிழ் – விகடன் பிரசுரம் | Buy Tamil & English Books Online | CommonFolks, accessed May 20, 2026, https://www.commonfolks.in/books/d/kanini-tamil
- UNIVERSITY OF JAFFNA FACULTY OF ARTS UNDERGRADUATE …, accessed May 20, 2026, https://www.arts.jfn.ac.lk/wp-content/uploads/2023/09/Guidelines-for-Extended-Abstract.pdf
- A Guide to Successful Peer Review Process & Submissions – KALANJIYAM – International Journal of Tamil Studies, accessed May 20, 2026, https://ngmtamil.in/a-guide-to-successful-peer-review-process-submissions/
- JELAS, accessed May 20, 2026, https://www.bharathuniv.ac.in/journal/english/index.html
- Submissions | International Research Journal of Tamil – IOR PRESS, accessed May 20, 2026, https://irjt.iorpress.org/index.php/irjt/about/submissions
- Guidelines for Abstract Submissions – Amrita Vishwa Vidyapeetham, accessed May 20, 2026, https://www.amrita.edu/events/innovative-technologies-and-social-work-transforming-the-contemporary-social-work-profession/guidelines/
- Research Paper Formatting Guidelines | PDF | Paragraph – Scribd, accessed May 20, 2026, https://www.scribd.com/document/396731561/Templete-Journal
- View of TEACHERS’ PERCEPTIONS TOWARDS THE LITERARY TEXTS USED IN TAMIL LITERATURE SUBJECT IN 2021 IN COMPARISON TO THE TEXTS USED IN 2016, accessed May 20, 2026, https://journalppw.com/index.php/jpsp/article/view/2254/1442
- Thesis Writing Services in Tamil Nadu | Professional PhD Thesis Help – IdeaLaunch, accessed May 20, 2026, https://idealaunch.in/thesis-writing-services-in-tamilnadu/
- Documenting Tamil Typeface Design Using Systematic Literature Review: Addressing the Methodological Gap – MySitasi System, accessed May 20, 2026, https://mysitasi.mohe.gov.my/uploads/get-media-file?refId=e34d0b89-c4ee-46a0-a8f5-59d73745742b
- தமிழ் இணையத்தோடு நான் கடந்து வந்த பாதை – Mangoidiots, accessed May 20, 2026, https://venkatarangan.com/blog/2024/02/my-article-in-kanitamil24-souvenir/
- Vasu Renganathan – School of Arts & Sciences, accessed May 20, 2026, https://www.sas.upenn.edu/~vasur/project.html
- Organized by Tamil University, Thanjavur, Tamilnadu, India Periyar Maniyammai Institute of Science and Technology, Thanjavur, Ta – INFITT Page, accessed May 20, 2026, https://uttamam.org/papers/tic2022.pdf
- Databases for Tamil Languages: Development and Utilization, accessed May 20, 2026, https://www.tamilcomputingjournal.org/databases-for-tamil-languages-development-and-utilization.html
- A Literature Review on Sentiment Analysis in Tamil Texts – ResearchGate, accessed May 20, 2026, https://www.researchgate.net/publication/338912499_A_Literature_Review_on_Sentiment_Analysis_in_Tamil_Texts
- Internet Library – Tamilcomputingjournal, accessed May 20, 2026, https://www.tamilcomputingjournal.org/internet-library.html
- LLM Benchmark Wars 2025-2026 | 24 Models Compared – Kaggle, accessed May 20, 2026, https://www.kaggle.com/datasets/alitaqishah/llm-benchmark-wars-2025-2026-24-models-compared
- Ultimate Guide – Best Open Source LLM For Tamil in 2026 – SiliconFlow, accessed May 20, 2026, https://www.siliconflow.com/articles/en/best-open-source-LLM-for-Tamil
- Asia LLM Benchmarks Map 2026: Frontier vs Domestic, accessed May 20, 2026, https://digitalinasia.com/llm-benchmarks-asian-languages-tour/
- Tamils and Technology: A Historical Overview | PDF – Scribd, accessed May 20, 2026, https://www.scribd.com/document/886797001/58
- Designing and implementing a Tamil language learning tool for educational institutions – Science Gate, accessed May 20, 2026, https://www.science-gate.com/IJAAS/Articles/2025/2025-12-12/1021833ijaas202512012.pdf
