சொற்கள் & அகராதிகள் – ஒரு ஒழுங்குபடுத்தப்பட்ட வழிகாட்டி

சொற்கள் & அகராதிகள் – ஒரு ஒழுங்குபடுத்தப்பட்ட வழிகாட்டி


1️⃣ மொழியியல் அடிப்படை கருத்துக்கள்

பிரிவு துணை‑கருத்துகள் பயன்பாடு / குறிப்புகள்
எழுத்து → அகரம் Glyph, Graph, Grapheme, Phone, Phoneme, Prosodeme எழுத்து அளவீடு, ஒலியியல் ஆய்வு
சொல் Syllable, Morpheme, Lexeme, Lemma, Stem, Root, Affix (prefix/infix/suffix) வார்த்தை‑விளக்கம், வடிவ‑மாற்றம்
அர்த்தம் Sememe, Seme, Tagmeme அர்த்த‑வியல் (semantics)
வாக்கியம் Subject, Predicate, Object, Complement, Modifier, Clause, Phrase வாக்கிய‑வியல் (syntax)
வாக்கிய‑வியல் Constituency, Hierarchy, Word‑order, Agreement, Recursion, Dependency வாக்கிய‑அமைப்பு பகுப்பாய்வு
இலக்கணம் (Thinai) Gender, Number, Person, Case, Tense, Mood, Voice, Aspect, Place, Time தமிழ் இலக்கண‑வகைகள் (திணை, பால, எண், இடம், காலம்)

2️⃣ அகராதிகள் & நிகண்டுகள் (தமிழ்)

வளம் வகை இணைப்பு
அகரமுதலி ஆன்லைன் அகராதி https://www.அகரமுதலி.com/
விக்சனரி (Wiktionary தமிழ்) பல்மொழி அகராதி https://ta.m.wiktionary.org
தமிழ் விக்கிபீடியா அறிவுக் கோவையில் விக்கி https://ta.wikipedia.org
சொற்குவை (Tamil Lexicon) அரசு அகராதி https://sorkuvai.tn.gov.in/
அகராதிகள்‑TamilVU (பழைய) PDF/HTML அகராதிகள் https://www.tamilvu.org/library/dicIndex.htm
Bharatavani Dictionary PDF அடிப்படையிலான அகராதி https://bharatavani.in/home/dictionaries
Digital Dictionaries of South Asia பல மொழிகளின் அகராதிகள் https://dsal.uchicago.edu/dictionaries/
குறிப்புப் நிகண்டுகள் (Tamil VU) Thesaurus‑style https://www.tamilvu.org/ta/library-thesContnt-274280
அகராதி தொகுப்பு (INFITT Awesome‑Tamil) GitHub list https://github.com/INFITTOfficial/awesome-tamil
அகராதி தொகுப்பு (Thani Thamizh Akarathi Kalanjiyam) Open‑source https://github.com/ThaniThamizhAkarathiKalanjiyam/agarathi
நிகண்டுகள் (அகராதி வகைகள்) DSAL வகை https://dsal.uchicago.edu/dictionaries/
அகராதி கோப்பு வடிவங்கள் .txt · .csv · .xlsx · .skos · .json · .rdf · .owl · .xml · .slob · .zim · .mdx · .ifo · .dict

3️⃣ மொழியியல் தரவு மூலங்கள்

மூலம் விவரம் இணைப்பு
ConceptNet (en‑ta) செமாண்டிக் நெட்வொர்க் https://archive.org/details/conceptnet-en-ta-html
WordNet (Princeton) ஆங்கில வினை‑நிகண்டு https://wordnet.princeton.edu/
Open Multilingual WordNet பல மொழிகளில் WordNet https://omwn.org/
GCIDE GNU Collaborative International Dictionary https://gcide.gnu.org.ua/
UniMorph வினை‑மாற்றம் தரவு https://unimorph.org/
Morfessor மோர்ஃபீம் விளைவு https://github.com/aalto-speech/morfessor
NLTK / spaCy / Stanza NLP toolkits (Tamil plugins) https://github.com/nltk/nltk, https://spacy.io/, https://stanfordnlp.github.io/stanza/
Tamil NLP Catalog கருவிகள், தரவுத்தொகுப்புகள் https://github.com/narVidhai/tamil-nlp-catalog
Indic‑Dict பல இந்திய மொழிகளின் Stardict கோப்புகள் https://github.com/indic-dict
AI4Bharat மொழி‑தொழில்நுட்ப API https://ai4bharat.iitm.ac.in/
CFILT (Computational Facilities for Indian Languages) Wordnet, Ontology, Corpus https://www.cfilt.iitb.ac.in/
GRETIL பழைய உரை‑தொகுப்புகள் https://gretil.sub.uni-goettingen.de/gretil.html
Frequency Words (ta) சொல்‑அதிர்வு பட்டியல் https://github.com/hermitdave/FrequencyWords/blob/master/content/2018/ta/ta_full.txt
All Tamil Nouns noun list https://github.com/KaniyamFoundation/all_tamil_nouns
All Tamil Words word list https://github.com/KaniyamFoundation/all_tamil_words
Tamil Corpus பல்வேறு கோப்புகள் https://github.com/neechalkaran/Tamil-corpus

4️⃣ ஆஃப்‌லைன் அகராதி சாப்ட்வேர்

பயன்பாடு OS வடிவங்கள் பதிவிறக்கம்
GoldenDict Windows · Linux · macOS .dsl, .mdx, .bgl, .slob, .stardict, … http://goldendict.org/
GoldenDict‑ng Windows · macOS · Linux ஒரே வடிவங்கள் https://github.com/xiaoyifang/goldendict-ng
DictTango Android .mdx https://github.com/freemdict/dicttango
Aard2 Android .slob, .dictd https://aarddict.org/
Treebolic WordNet Android · Web WordNet XML https://play.google.com/store/apps/developer?id=Bernard+Bou
Semantikos Android · Desktop WordNet, FrameNet https://play.google.com/store/apps/developer?id=Bernard+Bou
Poet Assistant Android .mdx, rhyming https://github.com/caarmen/poet-assistant
PyGlossary (converter) Cross‑platform dsl, mdx, csv, json, … https://github.com/ilius/pyglossary
Mdx Editor Windows .mdx https://github.com/LibreOffice/dictionaries

5️⃣ அகராதி கோப்பு வடிவங்கள் மற்றும் நூலகங்கள்

வடிவம் விளக்கம் உதாரண நூலகம்
.txt / .csv எளிய உரை அல்லது காமா‑பிரிக்கப்பட்ட FrequencyWords, Tamil Wordlist
.xlsx Excel தரவு Tamil Lexicon spreadsheets
.skos / .rdf / .owl / .xml Semantic Web (Linked Data) DBpedia‑Tamil, OntoLex
.slob SQLite‑based dictionary Aard2, Kiwix
.zim ZIM archive (offline web) Kiwix Tamil Wikipedia, Wiktionary
.mdx / .ifo / .dict Stardict family GoldenDict, Freemdict
.json / .rdf API / Linked Data UniMorph, ConceptNet
.ttl Turtle (RDF) Linked Open Data for Tamil

6️⃣ தொடர்பு மூலங்கள் (இணைய‑வழி)

பெயர் வகை URL
Tamil Virtual Academy (Tamil VU) கல்வி நூலகம் https://www.tamilvu.org/
Tamil NLP GitHub Collections கருவிகள் மற்றும் தரவு https://github.com/INFITTOfficial/awesome-tamil
Freemdict Cloud பல‑மொழி அகராதி கோப்புகள் https://cloud.freemdict.com/index.php/s/pgKcDcbSDTCzXCs
Kiwix Library ZIM அகராதி/விக்கி https://library.kiwix.org/#lang=tam
Indic‑Dict Stardict Stardict தொகுப்புகள் https://github.com/indic-dict/stardict-tamil
AI4Bharat API NLP சேவைகள் https://ai4bharat.iitm.ac.in/
CFILT WordNet WordNet மொத்தம் https://www.cfilt.iitb.ac.in/indowordnet/
Open Multilingual WordNet பல‑மொழி WordNet https://omwn.org/
ConceptNet Relations செமாந்திக் தொடர்புகள் https://github.com/commonsense/conceptnet5/wiki/Relations
GRETIL Text Repository பழைய உரை தொகுப்புகள் https://gretil.sub.uni-goettingen.de/gretil.html

7️⃣ சுருக்கம் & பயன்பாட்டு செயல்முறை

  1. தேவை அளவைக் குறிப்பிடுங்கள்
    • அகராதி‑தேடல், மார்ஃபாலஜி‑ஆய்வு, செமாந்திக்‑நிரல் அல்லது ஆஃப்‌லைன்‑அகராதி?
  2. வடிவம் தேர்ந்தெடுக்கவும்
    • வேகமான தேடலுக்கு .slob / .zim,
    • மாற்றத்திற்கு .mdx / .dsl,
    • API‑க்கு .json / .rdf.
  3. சாப்ட்வேர் நிறுவல்
    • GoldenDict (desktop) அல்லது Aard2 (Android) போன்றவற்றை நிறுவி, கோப்பை “Add Dictionary”‑ல் சேர்க்கவும்.
  4. தரவு இணைப்பு
    • Python‑இல் PyGlossary மூலம் .csv → .mdx மாற்றம்,
    • SPARQL‑இல் .rdf/.owl‑ஐ கேள்வி செய்யலாம்.
  5. மொழியியல் ஆய்வு
    • NLTK / spaCy / Stanza‑இல் Tamil‑model ஏற்றி, Morphology, POS, Dependency ஆகியவற்றை பெறலாம்.


You'll only receive email when they publish something new.

More from Prasanth
All posts