Эстәлеккә күсергә

Тезаурус

Википедия — ирекле энциклопедия мәғлүмәте
Тезаурус
ингл. linguistic thesaurus[1][2][3][…]
Рәсем
Кем хөрмәтенә аталған Тезаурус Роже[d]
Модель элементы Тезаурус Роже[d][4][5][6]
Өлөшләтә тура килә синонимдар һүҙлеге[d]
Үҙенсәлекте ҡулланыу миҫалы Asian multilingual thesaurus of geosciences[d]
 Тезаурус Викимилектә

Теза́урус (от грек. θησαυρός «хазина») дөйөм алғанда — махсус терминология. Махсус белем йәки эшмәкәрлек өлкәһе төшөнсәләрен, билдәләрен һәм терминдарын тулыһынса үҙ эсенә алған һүҙлек, мәғлүмәттәр йыйылмаһы, корпус йәки йыйылма ҡәтғиерәк һәм ентеклерәк, был дөрөҫ лексик, корпоратив коммуникацияға (бер дисциплина йәки һөнәр менән бәйле кешеләрҙең аралашыуын һәм үҙ-ара бәйләнешен аңлауына) булышлыҡ итергә тейеш; хәҙерге лингвистикала — семантик мөнәсәбәттәр (төшөнсәләр, антонимдар) күрһәтелгән махсус һүҙлек төрө.Тезаурустар айырым предмет өлкәләрен тасуирлау өсөн тәьҫирле ҡоралдарҙың береһе булып тора.

Шулай уҡ тезаурус төшөнсәһенә оҡшаш — глоссарий бар.

Глоссарий, тезаурус кеүек үк, белемдең ниндәй ҙә булһа өлкәһен үҙ эсенә алған махсус терминдар (аңлатмалары һәм комментарийҙары менән) йыйылмаһы булып тора. .Айырма ошо терминдарҙы ҡулланыуҙан ғибәрәт, шуға күрә глоссарий һәм тезаурус тулы булмаһа ла, синонимдар тип әйтергә мөмкин . Был хаҡта квантитатив тикшеренеүҙәр алып барыусы корпус анализы алымдары менән интернет-ресурстар һөйләй: sinonim.org, kartaslov.ru, synonymizer.ru 2022 йыл 25 сентябрь архивланған..

Беренсе тезаурустарҙы Филон Библскийҙың "Синонимдар Һүҙлеге"тип атайҙар. Ул VI быуатта шиғыр формаһында санскритта яҙылған Амара-кош терминына анығыраҡ тап килә. Тәүге заманса инглиз тезаурусын Питер Марк Роже (инглиз) 1805 йылда төҙөй. Ул 1852 йылда баҫылып сыға һәм шул ваҡыттан алып яңынан нәшер ителмәй.

1970 йылдарҙа тезаурустар мәғлүмәт-эҙләнеү мәсьәләләрендә әүҙем ҡулланыла башлай. Бындай тезаурустарҙа һүҙҙәр дескрипторҙар менән сағыштырыла, улар аша семантик бәйләнештәр урынлаштырыла[7].

Аңлатмалы һүҙлектән айырмалы, тезаурус мәғәнәне билдәләмә ярҙамында ғына түгел, ә һүҙҙе башҡа төшөнсәләр һәм уларҙың төркөмдәре менән сағыштырып та асыҡларға мөмкинлек бирә, бының һөҙөмтәһендә яһалма интеллект системаларының белем базаһын тулыландырыу өсөн файҙаланыла ала. Элек тезаурус термины, текстарҙа уны ҡулланыу миҫалдары менән тел лексикаһын тулы кимәлдә сағылдырған, һүҙлектең өҫтөнлөгө буйынса билдәләнә.. Әлеге ваҡытта төшөнсә мәғлүмәт технологиялары, Интернет селтәре һәм электрон хисаплау машинаһы системаларында һүҙҙәр эҙләгәндә машина тәржемәһе таралыуға бәйле килеп сыҡҡан һүҙлектәрҙе лә үҙ эсенә ала ЭВМ:

  • бер телле мәғлүмәт-эҙләнеү тезаурустары ;
  • күп телле мәғлүмәт-эҙләнеү тезаурустары[8].

Шулай уҡ термин тезаурус в ҡулланылышы мәғлүмәт теорияһы субъект эйә булған бөтә мәғлүмәттәрҙең йыйылмаһын билдәләү өсөн.

Индивидуум тезаурусы психологияһында мәғлүмәтте ҡабул итеүҙе һәм аңлауҙы ҡылыҡһырлай. Коммуникация теорияһы шулай уҡ ҡатмарлы системаның дөйөм тезаурусын ҡарай, уның элементтары үҙ-ара тәьҫир итешә[7].

  • Амара-коша (Амараның һүҙлеге)—беренсе һәм иң мөһим санскрит тезаурусы (III—IV быуат)
  • Тезаурус Роже (XIX быуат, яҡынса 15000 синсет).
  • Викиһүҙлек күп телле ирекле тулыландырылған һүҙлек һәм тезаурус (2004 йылдан әлеге ваҡытҡа тиклем, Викимедиа фонды проекты, Рус Викиһүҙлегендә (дата — 2013 йыл август) 390 мең самаһы төшөнсә бар.[9] Бөтәһе 212 мең мөнәсәбәт[10] шуларҙың 150 меңе рус теле менән мөнәсәбәттә[11]).
  • РуТез — рус теленең тезаурусы (автоматик индекслау ҡоралы булараҡ мәғлүмәт тикшеренеүҙәре үҙәге тарафынан булдырылған; 1997 йылдан алып әлеге көнгә тиклем эшкәртелә, 45 мең төшөнсә, 107 мең һүҙ һәм һүҙбәйләнеш, 177 мең мөнәсәбәт)[12].
  • Microsoft Word яйға һалынған тезаурус[13].
  • Совет яҙыусыһы С.Н.Есин «Яҙыусы тезаурусы»[14].
  • Глоссарий;
  • Идеографик һүҙлек;
  • Рус семантик һүҙлеге;
  • Семантик анализ;
  • Семантик селтәр;
  • Сағыштырма һүҙлек;
  • Онтология (информатика)
  • Диуану лөғәт әт-төрк
  1. https://books.google.com/books?id=WJAEsQscs70C&pg=PA99
  2. https://proceedings.caaconference.org/files/2000/16_Doerr_Kalomoirakis_CAA_2000.pdf
  3. https://www.lisedunetwork.com/indexing-language/
  4. linguistic thesaurus // https://books.google.com/books?id=WJAEsQscs70C&pg=PA99
  5. linguistic thesaurus // https://www.lisedunetwork.com/indexing-language/
  6. https://arxiv.org/ftp/cs/papers/0604/0604036.pdf
  7. 7,0 7,1 Тезаурус — статья из Большой советской энциклопедии
  8. ГОСТ Р 7.0.47-2008 СИБИД. http://docs.cntd.ru/. Дата обращения: 4 октябрь 2019. Архивировано 2 октябрь 2019 года.
  9. wikt:Участник: AKA MBG/Статистика: Размеры базы данных, созданной парсером Викисловаря, строка «meaning» в таблице.
  10. wikt:Участник: AKA MBG/Статистика: Размеры базы данных, созданной парсером Викисловаря, строка «relation» в таблице.
  11. wikt:Участник: AKA MBG/Статистика: Семантические отношения#Number of relations per language, столбец «total» в таблице.
  12. Онтологии для автоматической обработки текстов: описание понятий и лексических значений. Дата обращения: 12 ноябрь 2011. Архивировано 4 октябрь 2008 года.
  13. Поиск синонимов с помощью тезауруса - Word. Дата обращения: 18 ғинуар 2017. Архивировано 1 февраль 2017 года.
  14. Есин С. Н. Писательский тезаурус. Дата обращения: 3 март 2008. Архивировано 22 май 2008 года.