Машина тәржемәһе

Википедия — ирекле энциклопедия мәғлүмәте
Перейти к навигации Перейти к поиску
Машина тәржемәһе
Ҡыҫҡаса атамаһы MT[1]
Ҡайҙа өйрәнелә Обработка естественного языка[d]
Commons-logo.svg Машина тәржемәһе Викимилектә

Машина тәржемәһе — текстарҙы бер тәбиғи телдән икенсеһенә махсус компьютер программаһы ярҙамында тәржемә итеү (яҙып, телдән). Ошондай системаларҙы төҙөүгә бәйле ғилми тикшеренеүҙәр йүнәлеше лә шулай тип атала.

Машина тәржемәһендә ЭВМ менән кешенең үҙ-ара эшен ойоштороу төрҙәре[үҙгәртергә | вики-тексты үҙгәртергә]

  • Һуңынан мөхәррирләү аша: сығанаҡ тексты машина эшкәртә, ә кеше һөҙөмтәне мөхәррирләй.
  • Алдан мөхәррирләү аша: кеше тексты машина эшкәртеүенә әҙерләй (төрлөсә аңлана торған урындарҙы бөтөрә, тексты ябайлаштыра), шунан программа эшкәртеүе башлана.
  • Аралаш мөхәррирләү аша: кеше тәржемә системаһының барышына ҡыҫыла, ҡатмарлы осраҡтарҙы ҡулайлаштырып ебәрә.
  • Ҡатнаш системалар (мәҫәлән, алдан һәм һуңынан мөхәррирләү ҡулланыла).

Автоматлаштырылған тәржемә[үҙгәртергә | вики-тексты үҙгәртергә]

«Машина тәржемәһе» урынына ҡайһы берҙә автоматик тәржемә тигән фраза ҡулланыла. Әммә автоматлаштырылған тәржемә термины бөтөнләй башҡа мәғәнәгә эйә — программа тексты тәржемә итеүҙә бары тик кешегә ярҙам итә.

Автоматлаштырылған тәржемә түбәндәге эш итеү төрҙәрен күҙҙә тота:

  • Өлөшләтә автоматлаштырылған тәржемә: мәҫәлән, тәржемә итеүсе кеше компьютер һүҙлектәрен ҡуллана.
  • Хеҙмәт бүленеше хас булған система: компьютер ҡәтғи структуралы фразаларҙы ғына тәржемә итә ала (ләкин быны артынан төҙәтеп тормаҫлыҡ итеп эшләй), ә схемаға һыймаған бөтә осраҡтарҙы кешегә ҡалдыра.

Инглиз телендәге терминологияла ла ингл. machine translation, MT (тулыһынса автоматик тәржемә) һәм ингл. machine-aided йәки ингл. machine-assisted translation (MAT) (автоматлаштырылған) айырыла; әгәр икеһен дә белдереү талап ителһә, M(A)T тип яҙалар.

Машина тәржемәһе алгоритмдарын төҙөүгә бер нисә принципиаль ҡараш бар:

ҡағиҙәләргә нигеҙләнгәне (rule-based),

статистик, йәки статистикаға нигеҙләнгәне (statistical-based),

яһалма нейронлы селтәрҙәрҙең NMT машина тәржемәһе.

Беренсе ҡараш традицион алым булып тора һәм машина тәржемәһе системаларын эшләүселәрҙең күбеһе тарафынан ҡулланыла (Рәсәйҙә ПРОМТ, Францияла SYSTRAN, Гурманияла Linguatec һ.б.)[2]. Икенсе типҡа популяр Яндекс. Тәржемәсе, Google тәржемәсе, шулай уҡ ABBYY-ҙың яңы сервисы ҡарай[3]. Хәҙер системаларҙың күпселегеге гибрид булып тора — ҡағиҙәләрҙе, статистиканы һәм нейрон селтәрҙәрҙе берләштерә.

Статистик машина тәржемәһе[үҙгәртергә | вики-тексты үҙгәртергә]

Статистик машина тәржемәһе — машина тәржемәһе тел парҙарының ҙур күләмдәрен сағыштырыуға нигеҙләнә. Тел парҙары — бер телдә булған һөйләмдәрҙең икенсе телдә лә булыуы. Статистик машина тәржемәһе «үҙаллы белемен камиллашытыру» үҙенсәлеген эйә. Тел парҙары ни тиклем күберәк булһа һәм улар бер-береһенә ни тиклем нығыраҡ тап килһә, статистик машина тәржемәһенең һөҙөмтәһе лә шул тиклем яҡшыраҡ сифатлы була.

Машина тәржемәһенең тарихы[үҙгәртергә | вики-тексты үҙгәртергә]

ЭВМ-ды тәржемә өсөн ҡулланыу фекере 1947 йылда, беренсе ЭВМ-дар барлыҡҡа килгәс тә, АҠШ-та әйтелә. Машина тәржемәһе халыҡҡа беренсе тапҡыр 1954 йылда күрһәтелә. Ул система үтә ябай булһа ла (250 һүҙ, 6 грамматик ҡағиҙә, бер нисә ябай фразаны тәржемә итеү), был эксперимент киң яңғыраш ала: Англияла, Болгарияла, ГДР-ҙа, Италияла, Ҡытайҙа, Францияла, ГФР-ҙа, Японияла һәм башҡа илдәрҙә тикшеренеүҙәр башлана; шул уҡ 1954 йылда СССР ҙа ҡушыла.

1960-сы йылдар уртаһына АҠШ-та русса-инглизсә тәржемәнең ике системаһы ғәмәли ҡулланыуға тәҡдим ителә:

  • MARK (АҠШ Хәрби Һауа көстәренең Сит ил техникаһы департаментында);
  • GAT (Джорджтаун университеты эшләнмәһе, Ок Ридж Атом энергияһы милли лабораторияһында һәм Италияның Испра ҡалаһындағы Евратом үҙәгендә).

Әммә бындай системаларҙы баһалау өсөн ойошторолған комиссия ALPAC[en], машина тәржемәһенең ныҡ түбән сифатлы булыуы сәбәпле, уны ҡулланыу АҠШ шарттарында рентабелле түгел тип таба. Комиссия теоретик эшләнмәләрҙе туҡтатмаҫҡа, тәрәнәйтергә тәҡдим итә, ләкин уның һығымталары финанслауҙы кәметеүгә, хатта был тема буйынса эштәрҙе ябыуға килтерә.

Шуға ҡарамаҫтан, ҡайһы бер илдәрҙә тикшеренеүҙәр дауам итә, хисаплау техникаһының даими үҫеше быға этәргес бирә. Миникомпьютерҙарҙың һәм персональ компьютерҙарҙың барлыҡҡа килеүе, улар менән бергә ҡатмарлыраҡ һүҙлек системалары, эҙләгестәр һәм тәбиғи тел бирелмәләре менән эшләгән башҡа системалар барлыҡҡа килеүе эшмәкәрлекте яңы кимәлгә күтәрә. Халыҡ-ара бәйләнештәрҙең үҫеше лә бындай тәржемәгә ихтыяжды арттыра. 1980-се йылдарҙа тәржемә системаларын ҡулланыу ныҡлы киңәйә, был тема буйынса коммерция эшләнмәләре баҙары барлыҡҡа килә.

Әлеге ваҡытта машина тәржемәһе буйынса коммерция проекттары бик күп. Был өлкәлә SYSTRAN[en] компанияһы башлап юл һалыусыларҙың береһе була. Рәсәйҙә машина тәржемәһен үҫтереүгә А. И. Герцен исемендәге Рәсәй дәүләт педагогия университетындағы профессор Р. Г. Пиотровский етәкселегендәге төркөм ҙур өлөш индерә.

Иҫкәрмәләр[үҙгәртергә | вики-тексты үҙгәртергә]

Әҙәбиәт[үҙгәртергә | вики-тексты үҙгәртергә]

Һылтанмалар[үҙгәртергә | вики-тексты үҙгәртергә]