Як і з чого готують електронні словники…

19.07.2015

Як і з чого готують електронні словники.
Як і з чого готують електронні словники.

Електронні словники стали в наш час одними з найбільш популярних програмних продуктів і дуже успішно конкурують зі своїми традиційними паперовими побратимами. І, загалом-то, це природно: переважна більшість документів сьогодні готується з допомогою персонального комп’ютера, так і переваги потужних засобів пошуку в електронних словниках мало кого залишать байдужими. Правда, у відношенні словникового матеріалу завжди постає питання його якості – адже всі відомі сьогодні серйозні і популярні традиційні словники є плодом багаторічної роботи професіоналів-лінгвістів. На електронних ж словниках за рідкісним винятком ніякої інформації про авторів матеріалу не наводиться, так що в певному сенсі користувач купує «кота в мішку».

На ринку зараз найбільшою популярністю серед електронних загальнолексичних словників користуються чотири: «Контекст» компанії «Інформатик», «МультиЛекс» компанії «МедиаЛингва», «Lingvo» компанії ABBYY і «Polyglossum» видавничого дому «ETS». З них тільки «МультиЛекс» має достовірно відомі корені: як написано на його обкладинці, це електронна версія відомого «Нового Великого Англо-російського словника» під редакцією Д. Ю. Апресяна і Медниковой. На інших походження словника обходиться мовчанням. Тому ми вирішили дослідити їх, порівнявши з, мабуть, найбільш популярним англо-російським словником, широко відомим як «словник Мюллера» («Англо-російський словник» під редакцією В. К. Мюллера). Для цього ми в середині червня вирушили в один з центральних московських книжкових магазинів «Бібліо-Глобус» і там придбали три електронних словника (дані наведено з обкладинки продуктів):

«Polyglossum-II «, великий англо-російсько-англійський общелексический словник (близько 600,000 термінів). Розробники: Polyglossum Inc. USA і «ETS» Publishing House, Russia.

«Lingvo 5.0 «, великий англо-російський словник (70,000 статей). Розробник: BIT Software.

«Контекст 3.51 «, професійний словник загальної лексики (близько 180,000 слів). Розробник: АТ «Інформатик».

як еталон було взято те Англо-російського словника під редакцією Ст.К. Мюллера, видання 23-е, стереотипне (близько 53,000 словникових статей), виданий в 1992 році видавництвом «Російська мова». Як кажуть фахівці, саме на нього дуже схожі придбані нами електронні словники.

Одразу зауважимо, що це порівняння має характер журналістського розслідування, і ми зовсім не претендуємо на істину в останній інстанції. Однак, як нам здається, такий матеріал повинен допомогти орієнтуватися на ринку всім користувачам електронних словників, особливо професійним перекладачам.

Порівняння словників

Почати ми вирішили з того, щоб визначити, чи дійсно в електронних словниках використовується англо-російський словник В. К. Мюллера, і якщо так, то в якій мірі. Для цього було проведено вибіркове порівняння за такими параметрами:

  • словник (англійські словникові статті)
  • приклади, вирази, які використовуються в статтях
  • російські переклади статей і прикладів
  • структура словникових статей, склад і порядок проходження значень і прикладів
  • транскрипція слів

Відразу зауважимо, що з порівнянням транскрипцій виникли певні проблеми: у словнику Polyglossum вони просто не наведено, тому і порівнювати було не з чим.

При дослідженні словникові статті розбивалися по цим параметрам на п’ять груп:

1. Повністю або практично повністю збігаються зі статтями словника Мюллера. У цю групу включалися словникові статті, відмінності яких від паперового еталона полягало в наступному:

  • рознесення статей з додатків за алфавітом словника, зміна алфавітного порядку статей
  • показ фрагментів словникових статей словника як окремих статей
  • об’єднання або розбивка за різними статтями омонімів, тобто слів з різним значенням, однаковим написанням)
  • перейменування послід словника (наприклад, «прог.» на «adj.») або їх втрата
  • відсутність наголосів, точок у «е», втрата відмінностей між i з точкою і без, різними накресленнями a в транскрипції.
  • пропущені та додані знаки пунктуації
  • відмінності в порядку нумерації значень
  • розкриття тильд і дужок
  • заміна дефіса в словах пропуском чи написання
  • відсутність артиклів та частки to перед окремими словами
  • втрата курсиву та інших стилів оформлення тексту

2. Трохи відредаговані – словникові статті, мають відмінності, що зачіпають не більше 20% від обсягу статті; збереження прикладів з перекладами, додавання синонімів.

3. Істотно відредаговані — всі інші зміни у статтях

4. Додані до тексту статті словника

5. Опущені в порівнянні з текстом статті словника

Для порівняння словникових матеріалів програм і словника Мюллера використовувалися суцільні вибірки об’ємом в один друкований аркуш словника. Для того, щоб вибрані статті досить повно представляли загальну структуру словників, сторінки для аналізу були обрані випадковим чином (з книги обсягом 800 листів були взяті сторінки 96, 200, 333, 666 і 770). В середньому, кількість словникових статей на сторінці становить близько 70. Так як статті, взяті для аналізу, відносяться до різних частин мови і взяті з різних частин словника, то на підставі їх порівняння цілком можна зробити висновки про ступінь подібності аналізованих словників.

У відповідності з практикою, прийнятою при виданні паперових словників, ми вважаємо, що одна словникова стаття включає в себе всі варіанти перекладу слова, його похідні форми і приклади. У словнику «Polyglossum» як окремі статті оформлені не тільки різні форми одного слова і стійкі словосполучення з ним, але і більшість прикладів до цього слова, тому для порівняння ми групували їх, вважаючи однією статтею.

Таблиця 1. Результати порівняння вибірок по сторінкам для Контекст 3.51

Короткий опис статті: електронний словник

Джерело: Як і з чого готують електронні словники…

Також ви можете прочитати