Машина тәржемәһе
Машина тәржемәһе | |
Ҡыҫҡаса атамаһы | MT[1] |
---|---|
Ҡайҙа өйрәнелә | обработка естественного языка[d] |
Машина тәржемәһе Викимилектә |
Машина тәржемәһе — текстарҙы бер тәбиғи телдән икенсеһенә махсус компьютер программаһы ярҙамында тәржемә итеү (яҙып, телдән). Ошондай системаларҙы төҙөүгә бәйле ғилми тикшеренеүҙәр йүнәлеше лә шулай тип атала.
Машина тәржемәһендә ЭВМ менән кешенең үҙ-ара эшен ойоштороу төрҙәре
[үҙгәртергә | сығанаҡты үҙгәртеү]- Һуңынан мөхәррирләү аша: сығанаҡ тексты машина эшкәртә, ә кеше һөҙөмтәне мөхәррирләй.
- Алдан мөхәррирләү аша: кеше тексты машина эшкәртеүенә әҙерләй (төрлөсә аңлана торған урындарҙы бөтөрә, тексты ябайлаштыра), шунан программа эшкәртеүе башлана.
- Аралаш мөхәррирләү аша: кеше тәржемә системаһының барышына ҡыҫыла, ҡатмарлы осраҡтарҙы ҡулайлаштырып ебәрә.
- Ҡатнаш системалар (мәҫәлән, алдан һәм һуңынан мөхәррирләү ҡулланыла).
Автоматлаштырылған тәржемә
[үҙгәртергә | сығанаҡты үҙгәртеү]«Машина тәржемәһе» урынына ҡайһы берҙә автоматик тәржемә тигән фраза ҡулланыла. Әммә автоматлаштырылған тәржемә термины бөтөнләй башҡа мәғәнәгә эйә — программа тексты тәржемә итеүҙә бары тик кешегә ярҙам итә.
Автоматлаштырылған тәржемә түбәндәге эш итеү төрҙәрен күҙҙә тота:
- Өлөшләтә автоматлаштырылған тәржемә: мәҫәлән, тәржемә итеүсе кеше компьютер һүҙлектәрен ҡуллана.
- Хеҙмәт бүленеше хас булған система: компьютер ҡәтғи структуралы фразаларҙы ғына тәржемә итә ала (ләкин быны артынан төҙәтеп тормаҫлыҡ итеп эшләй), ә схемаға һыймаған бөтә осраҡтарҙы кешегә ҡалдыра.
Инглиз телендәге терминологияла ла ингл. machine translation, MT (тулыһынса автоматик тәржемә) һәм ингл. machine-aided йәки ингл. machine-assisted translation (MAT) (автоматлаштырылған) айырыла; әгәр икеһен дә белдереү талап ителһә, M(A)T тип яҙалар.
Машина тәржемәһе алгоритмдарын төҙөүгә бер нисә принципиаль ҡараш бар:
ҡағиҙәләргә нигеҙләнгәне (rule-based),
статистик, йәки статистикаға нигеҙләнгәне (statistical-based),
яһалма нейронлы селтәрҙәрҙең NMT машина тәржемәһе.
Беренсе ҡараш традицион алым булып тора һәм машина тәржемәһе системаларын эшләүселәрҙең күбеһе тарафынан ҡулланыла (Рәсәйҙә ПРОМТ, Францияла SYSTRAN, Гурманияла Linguatec һ.б.)[2]. Икенсе типҡа популяр Яндекс. Тәржемәсе, Google тәржемәсе, шулай уҡ ABBYY-ҙың яңы сервисы ҡарай[3]. Хәҙер системаларҙың күпселегеге гибрид булып тора — ҡағиҙәләрҙе, статистиканы һәм нейрон селтәрҙәрҙе берләштерә.
Статистик машина тәржемәһе
[үҙгәртергә | сығанаҡты үҙгәртеү]Статистик машина тәржемәһе — машина тәржемәһе тел парҙарының ҙур күләмдәрен сағыштырыуға нигеҙләнә. Тел парҙары — бер телдә булған һөйләмдәрҙең икенсе телдә лә булыуы. Статистик машина тәржемәһе «үҙаллы белемен камиллашытыру» үҙенсәлеген эйә. Тел парҙары ни тиклем күберәк булһа һәм улар бер-береһенә ни тиклем нығыраҡ тап килһә, статистик машина тәржемәһенең һөҙөмтәһе лә шул тиклем яҡшыраҡ сифатлы була.
Машина тәржемәһенең тарихы
[үҙгәртергә | сығанаҡты үҙгәртеү]ЭВМ-ды тәржемә өсөн ҡулланыу фекере 1947 йылда, беренсе ЭВМ-дар барлыҡҡа килгәс тә, АҠШ-та әйтелә. Машина тәржемәһе халыҡҡа беренсе тапҡыр 1954 йылда күрһәтелә. Ул система үтә ябай булһа ла (250 һүҙ, 6 грамматик ҡағиҙә, бер нисә ябай фразаны тәржемә итеү), был эксперимент киң яңғыраш ала: Англияла, Болгарияла, ГДР-ҙа, Италияла, Ҡытайҙа, Францияла, ГФР-ҙа, Японияла һәм башҡа илдәрҙә тикшеренеүҙәр башлана; шул уҡ 1954 йылда СССР ҙа ҡушыла.
1960-сы йылдар уртаһына АҠШ-та русса-инглизсә тәржемәнең ике системаһы ғәмәли ҡулланыуға тәҡдим ителә:
- MARK (АҠШ Хәрби Һауа көстәренең Сит ил техникаһы департаментында);
- GAT (Джорджтаун университеты эшләнмәһе, Ок Ридж Атом энергияһы милли лабораторияһында һәм Италияның Испра ҡалаһындағы Евратом үҙәгендә).
Әммә бындай системаларҙы баһалау өсөн ойошторолған комиссия ALPAC[en], машина тәржемәһенең ныҡ түбән сифатлы булыуы сәбәпле, уны ҡулланыу АҠШ шарттарында рентабелле түгел тип таба. Комиссия теоретик эшләнмәләрҙе туҡтатмаҫҡа, тәрәнәйтергә тәҡдим итә, ләкин уның һығымталары финанслауҙы кәметеүгә, хатта был тема буйынса эштәрҙе ябыуға килтерә.
Шуға ҡарамаҫтан, ҡайһы бер илдәрҙә тикшеренеүҙәр дауам итә, хисаплау техникаһының даими үҫеше быға этәргес бирә. Миникомпьютерҙарҙың һәм персональ компьютерҙарҙың барлыҡҡа килеүе, улар менән бергә ҡатмарлыраҡ һүҙлек системалары, эҙләгестәр һәм тәбиғи тел бирелмәләре менән эшләгән башҡа системалар барлыҡҡа килеүе эшмәкәрлекте яңы кимәлгә күтәрә. Халыҡ-ара бәйләнештәрҙең үҫеше лә бындай тәржемәгә ихтыяжды арттыра. 1980-се йылдарҙа тәржемә системаларын ҡулланыу ныҡлы киңәйә, был тема буйынса коммерция эшләнмәләре баҙары барлыҡҡа килә.
Әлеге ваҡытта машина тәржемәһе буйынса коммерция проекттары бик күп. Был өлкәлә SYSTRAN[en] компанияһы башлап юл һалыусыларҙың береһе була. Рәсәйҙә машина тәржемәһен үҫтереүгә А. И. Герцен исемендәге Рәсәй дәүләт педагогия университетындағы профессор Р. Г. Пиотровский етәкселегендәге төркөм ҙур өлөш индерә.
Иҫкәрмәләр
[үҙгәртергә | сығанаҡты үҙгәртеү]Әҙәбиәт
[үҙгәртергә | сығанаҡты үҙгәртеү]- Автоматический перевод / И. М. Богуславский // Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов. — М. : Большая российская энциклопедия, 2004—2017.
- О. С. Кулагина. О современном состоянии машинного перевода // Математические вопросы кибернетики, вып. 3, М.: Наука, 1991, стр. 5—50. Библиография из 140 названий. ISBN 5-02-014323-5.
- Гращенко Л. А., Клышинский Э. С., Тумковский С. Р., Усманов З. Д. Концептуальная модель системы русско-таджикского машинного перевода // Доклады Академии наук Республики Таджикистан. — 2011. — том 54, № 4. — С. 279—285.
- Будущее машинного перевода // Компьютерра № 21, 5 июня 2002.