சொற்கள் & அகராதிகள் – ஒரு ஒழுங்குபடுத்தப்பட்ட வழிகாட்டி
September 16, 2025•691 words
சொற்கள் & அகராதிகள் – ஒரு ஒழுங்குபடுத்தப்பட்ட வழிகாட்டி
1️⃣ மொழியியல் அடிப்படை கருத்துக்கள்
பிரிவு | துணை‑கருத்துகள் | பயன்பாடு / குறிப்புகள் |
---|---|---|
எழுத்து → அகரம் | Glyph, Graph, Grapheme, Phone, Phoneme, Prosodeme | எழுத்து அளவீடு, ஒலியியல் ஆய்வு |
சொல் | Syllable, Morpheme, Lexeme, Lemma, Stem, Root, Affix (prefix/infix/suffix) | வார்த்தை‑விளக்கம், வடிவ‑மாற்றம் |
அர்த்தம் | Sememe, Seme, Tagmeme | அர்த்த‑வியல் (semantics) |
வாக்கியம் | Subject, Predicate, Object, Complement, Modifier, Clause, Phrase | வாக்கிய‑வியல் (syntax) |
வாக்கிய‑வியல் | Constituency, Hierarchy, Word‑order, Agreement, Recursion, Dependency | வாக்கிய‑அமைப்பு பகுப்பாய்வு |
இலக்கணம் (Thinai) | Gender, Number, Person, Case, Tense, Mood, Voice, Aspect, Place, Time | தமிழ் இலக்கண‑வகைகள் (திணை, பால, எண், இடம், காலம்) |
2️⃣ அகராதிகள் & நிகண்டுகள் (தமிழ்)
வளம் | வகை | இணைப்பு |
---|---|---|
அகரமுதலி | ஆன்லைன் அகராதி | https://www.அகரமுதலி.com/ |
விக்சனரி (Wiktionary தமிழ்) | பல்மொழி அகராதி | https://ta.m.wiktionary.org |
தமிழ் விக்கிபீடியா | அறிவுக் கோவையில் விக்கி | https://ta.wikipedia.org |
சொற்குவை (Tamil Lexicon) | அரசு அகராதி | https://sorkuvai.tn.gov.in/ |
அகராதிகள்‑TamilVU (பழைய) | PDF/HTML அகராதிகள் | https://www.tamilvu.org/library/dicIndex.htm |
Bharatavani Dictionary | PDF அடிப்படையிலான அகராதி | https://bharatavani.in/home/dictionaries |
Digital Dictionaries of South Asia | பல மொழிகளின் அகராதிகள் | https://dsal.uchicago.edu/dictionaries/ |
குறிப்புப் நிகண்டுகள் (Tamil VU) | Thesaurus‑style | https://www.tamilvu.org/ta/library-thesContnt-274280 |
அகராதி தொகுப்பு (INFITT Awesome‑Tamil) | GitHub list | https://github.com/INFITTOfficial/awesome-tamil |
அகராதி தொகுப்பு (Thani Thamizh Akarathi Kalanjiyam) | Open‑source | https://github.com/ThaniThamizhAkarathiKalanjiyam/agarathi |
நிகண்டுகள் (அகராதி வகைகள்) | DSAL வகை | https://dsal.uchicago.edu/dictionaries/ |
அகராதி கோப்பு வடிவங்கள் | .txt · .csv · .xlsx · .skos · .json · .rdf · .owl · .xml · .slob · .zim · .mdx · .ifo · .dict | – |
3️⃣ மொழியியல் தரவு மூலங்கள்
மூலம் | விவரம் | இணைப்பு |
---|---|---|
ConceptNet (en‑ta) | செமாண்டிக் நெட்வொர்க் | https://archive.org/details/conceptnet-en-ta-html |
WordNet (Princeton) | ஆங்கில வினை‑நிகண்டு | https://wordnet.princeton.edu/ |
Open Multilingual WordNet | பல மொழிகளில் WordNet | https://omwn.org/ |
GCIDE | GNU Collaborative International Dictionary | https://gcide.gnu.org.ua/ |
UniMorph | வினை‑மாற்றம் தரவு | https://unimorph.org/ |
Morfessor | மோர்ஃபீம் விளைவு | https://github.com/aalto-speech/morfessor |
NLTK / spaCy / Stanza | NLP toolkits (Tamil plugins) | https://github.com/nltk/nltk, https://spacy.io/, https://stanfordnlp.github.io/stanza/ |
Tamil NLP Catalog | கருவிகள், தரவுத்தொகுப்புகள் | https://github.com/narVidhai/tamil-nlp-catalog |
Indic‑Dict | பல இந்திய மொழிகளின் Stardict கோப்புகள் | https://github.com/indic-dict |
AI4Bharat | மொழி‑தொழில்நுட்ப API | https://ai4bharat.iitm.ac.in/ |
CFILT (Computational Facilities for Indian Languages) | Wordnet, Ontology, Corpus | https://www.cfilt.iitb.ac.in/ |
GRETIL | பழைய உரை‑தொகுப்புகள் | https://gretil.sub.uni-goettingen.de/gretil.html |
Frequency Words (ta) | சொல்‑அதிர்வு பட்டியல் | https://github.com/hermitdave/FrequencyWords/blob/master/content/2018/ta/ta_full.txt |
All Tamil Nouns | noun list | https://github.com/KaniyamFoundation/all_tamil_nouns |
All Tamil Words | word list | https://github.com/KaniyamFoundation/all_tamil_words |
Tamil Corpus | பல்வேறு கோப்புகள் | https://github.com/neechalkaran/Tamil-corpus |
4️⃣ ஆஃப்லைன் அகராதி சாப்ட்வேர்
பயன்பாடு | OS | வடிவங்கள் | பதிவிறக்கம் |
---|---|---|---|
GoldenDict | Windows · Linux · macOS | .dsl, .mdx, .bgl, .slob, .stardict, … | http://goldendict.org/ |
GoldenDict‑ng | Windows · macOS · Linux | ஒரே வடிவங்கள் | https://github.com/xiaoyifang/goldendict-ng |
DictTango | Android | .mdx | https://github.com/freemdict/dicttango |
Aard2 | Android | .slob, .dictd | https://aarddict.org/ |
Treebolic WordNet | Android · Web | WordNet XML | https://play.google.com/store/apps/developer?id=Bernard+Bou |
Semantikos | Android · Desktop | WordNet, FrameNet | https://play.google.com/store/apps/developer?id=Bernard+Bou |
Poet Assistant | Android | .mdx, rhyming | https://github.com/caarmen/poet-assistant |
PyGlossary (converter) | Cross‑platform | dsl, mdx, csv, json, … | https://github.com/ilius/pyglossary |
Mdx Editor | Windows | .mdx | https://github.com/LibreOffice/dictionaries |
5️⃣ அகராதி கோப்பு வடிவங்கள் மற்றும் நூலகங்கள்
வடிவம் | விளக்கம் | உதாரண நூலகம் |
---|---|---|
.txt / .csv | எளிய உரை அல்லது காமா‑பிரிக்கப்பட்ட | FrequencyWords, Tamil Wordlist |
.xlsx | Excel தரவு | Tamil Lexicon spreadsheets |
.skos / .rdf / .owl / .xml | Semantic Web (Linked Data) | DBpedia‑Tamil, OntoLex |
.slob | SQLite‑based dictionary | Aard2, Kiwix |
.zim | ZIM archive (offline web) | Kiwix Tamil Wikipedia, Wiktionary |
.mdx / .ifo / .dict | Stardict family | GoldenDict, Freemdict |
.json / .rdf | API / Linked Data | UniMorph, ConceptNet |
.ttl | Turtle (RDF) | Linked Open Data for Tamil |
6️⃣ தொடர்பு மூலங்கள் (இணைய‑வழி)
பெயர் | வகை | URL |
---|---|---|
Tamil Virtual Academy (Tamil VU) | கல்வி நூலகம் | https://www.tamilvu.org/ |
Tamil NLP GitHub Collections | கருவிகள் மற்றும் தரவு | https://github.com/INFITTOfficial/awesome-tamil |
Freemdict Cloud | பல‑மொழி அகராதி கோப்புகள் | https://cloud.freemdict.com/index.php/s/pgKcDcbSDTCzXCs |
Kiwix Library | ZIM அகராதி/விக்கி | https://library.kiwix.org/#lang=tam |
Indic‑Dict Stardict | Stardict தொகுப்புகள் | https://github.com/indic-dict/stardict-tamil |
AI4Bharat API | NLP சேவைகள் | https://ai4bharat.iitm.ac.in/ |
CFILT WordNet | WordNet மொத்தம் | https://www.cfilt.iitb.ac.in/indowordnet/ |
Open Multilingual WordNet | பல‑மொழி WordNet | https://omwn.org/ |
ConceptNet Relations | செமாந்திக் தொடர்புகள் | https://github.com/commonsense/conceptnet5/wiki/Relations |
GRETIL Text Repository | பழைய உரை தொகுப்புகள் | https://gretil.sub.uni-goettingen.de/gretil.html |
7️⃣ சுருக்கம் & பயன்பாட்டு செயல்முறை
- தேவை அளவைக் குறிப்பிடுங்கள் –
- அகராதி‑தேடல், மார்ஃபாலஜி‑ஆய்வு, செமாந்திக்‑நிரல் அல்லது ஆஃப்லைன்‑அகராதி?
- அகராதி‑தேடல், மார்ஃபாலஜி‑ஆய்வு, செமாந்திக்‑நிரல் அல்லது ஆஃப்லைன்‑அகராதி?
- வடிவம் தேர்ந்தெடுக்கவும் –
- வேகமான தேடலுக்கு .slob / .zim,
- மாற்றத்திற்கு .mdx / .dsl,
- API‑க்கு .json / .rdf.
- வேகமான தேடலுக்கு .slob / .zim,
- சாப்ட்வேர் நிறுவல் –
- GoldenDict (desktop) அல்லது Aard2 (Android) போன்றவற்றை நிறுவி, கோப்பை “Add Dictionary”‑ல் சேர்க்கவும்.
- GoldenDict (desktop) அல்லது Aard2 (Android) போன்றவற்றை நிறுவி, கோப்பை “Add Dictionary”‑ல் சேர்க்கவும்.
- தரவு இணைப்பு –
- Python‑இல் PyGlossary மூலம் .csv → .mdx மாற்றம்,
- SPARQL‑இல் .rdf/.owl‑ஐ கேள்வி செய்யலாம்.
- Python‑இல் PyGlossary மூலம் .csv → .mdx மாற்றம்,
- மொழியியல் ஆய்வு –
- NLTK / spaCy / Stanza‑இல் Tamil‑model ஏற்றி, Morphology, POS, Dependency ஆகியவற்றை பெறலாம்.
- NLTK / spaCy / Stanza‑இல் Tamil‑model ஏற்றி, Morphology, POS, Dependency ஆகியவற்றை பெறலாம்.