Читаємо електронні книги англійською без словників і перекладачів.

12.07.2015

Читаємо електронні книги англійською без словників і перекладачів
1. Інтро. Особисте

Читаємо електронні книги англійською без словників і перекладачів.

Я готуюся до мовного іспиту IELTS (International English Language Testing System) — мабуть, самому популярному

тесту на знання англійської. Якщо хочеться емігрувати, знайти роботу в міжнародній компанії — диплом IELTS дуже знадобиться. Шкала оцінок — від 0 (від випробуваного не вдалося отримати навіть виразного мукання) до 9 (експерт — випробуваний біса гарний і може влаштуватися навіть редактором лондонської газети).

Для навчання, наприклад, у США, потрібно не менше 6.5 балів (буває і 6, але не часто), для роботи — 7 і вище. А для еміграції, припустимо, в Канаду — чим вище оцінка, тим краще. Мій прогнозований бал перед здачею тесту — 5.5. Значить, що я можу читати газети, дивитися кіно, вести бесіди в знайомих ситуаціях, писати відповіді на листи. Але для роботи в центральному офісі Гугла явно недостатньо.

Що ж робити, щоб підтягнути рівень мови? Звичайно ж, почати використовувати його у своєму житті якомога частіше і більше. Наприклад, читати книги англійською.

Сказано — зроблено. І ось я вже їду в бангкокском метро з читалкою Amazone Kindle і забитої в неї книгою «A Game of Thrones» (так, та сама «Гра престолів»). Перша сторінка проходить добре. Є кілька незрозумілих слів, але можна здогадатися. Друга сторінка — трохи гірше. Кілька незрозумілих слів, не здогадатися. Лізу в телефон, перекладаю. Далі слів стало з’являтися більше. Читання перетворилося на метушню з перекладачем і читалкою. Подумки прикинувши якість розуміння тексту і швидкість читання бачу, що читалку доведеться замінити на інший девайс.

У 2 раунді я вийшов проти книги озброївшись iPad Air з сімкою безлімітного місцевого інтернету. Бангкокський скайтрейн (поїзд на естакадах над вулицями), все та ж книга «A Game of Thrones». Справа пішла швидше — переводити слова стало зручніше, швидкість читання помітно зросла. Я вже було зрадів, але тут скайтрейн доїхав до району Пайя Тай і ми опинилися серед висоток. Мобільний сигнал став глючити, а разом з ним — інтернет. Читання помітно тормознулось.

З цими книгами, словниками і метушнею потрібно щось робити. Так, навіть у такий усталений процес, як читання книг, можна внести щось нове. Звичайно, незручності можна просто ігнорувати. Але в мізках вже росло радісне передчуття від можливості спорудити новий велосипед з квадратними колесами.

2. Будуємо велосипед

Я відкрив на ноутбуці epub файл з книгою і python.

Було б добре зняти з себе всю метушню з перекладу незрозумілих слів у книзі в процесі читання. В ідеалі — взагалі не стосуватися перекладачів, читаючи книгу.

Лінгвісти кажуть, що для побутових ситуацій людям досить близько 5 000 англійських слів. Для читання нормальної книги, очевидно, потрібно більше. Я накидав простий python скрипт, який витягнув з epub весь осмислений текст і підрахував в ньому кількість слів. Вийшло більше 300 000. Мде.

Взагалі слова в тексті мають властивість повторюватися. Наступним кроком я навчив скрипт виділяти список слів, використаних у тексті — словник. Словник книги склав приблизно 19 000 слів.

Очевидно, що в словник з 19 000 слів, входять ті, що я змушений перекладати. Здорово було б знайти незнайомі слова скриптом! Я порахував кількість повторень кожного слова в тексті. З 300 000 слів книги — майже половина припала на повторення слів «a», «the», «of», «and», «I», «ам», «do» і т. д.

Розпорошив ще кілька epub файлів з книгами і перевірив дані. Стало видно, що спираючись на частотний розподіл слів у тексті, можна автоматично знайти в книзі ті слова, які я, швидше за все, не знаю. Чим частіше слово зустрілося — тим більше шансів, що воно мені знайоме. Кілька маніпуляцій зі списком — і я отримав список з 6 500 слів, які я, швидше за все, буду дивитися до словника при читанні.

За кілька вечорів додав до первісного варіанту сценарію всякі поліпшень: розпізнавання множини (apples наводимо до форми apple), приведення дієслів до инфинитиву (working перетворюється в work) і т. д. Побудував частотні розподілу за причесанному списком, і на основі результату вибрав досить рідкісні слова, вимагають перекладу. Додав до цієї справи Google Translate API і зібрав новий epub файл з книгою, текст якої вже вставлені переклади складних слів.

Читаємо електронні книги англійською без словників і перекладачів.

3. А далі?

Пора тестувати результат. Кілька глав з «A Game of Thrones» пролетіли непомітно. Все зрозуміло. Або майже все. За ці кілька глав жодного разу не знадобилася допомога перекладача. Перевірив книгу на інших людях, але з приблизно таким же рівнем мови — спрацювало і для них.

bamboo.57uff3r.net/

З її допомогою ви можете безкоштовно збирати свої epub книги, які можна читати, не заглядаючи в словники та перекладачі.

Читаємо електронні книги англійською без словників і перекладачів.

Звичайно, там ще багато роботи. Потрібно коректно перекладати слова з кількома значеннями, покращувати переклад різних форм дієслів, зробити настроюється рівень перекладу для різних рівнів володіння англійською, готувати вправи для запам’ятовування нових слів. Цим я буду займатися на дозвіллі в найближчі місяці.

Всім спасибі! Прогресу в англійській та хороших книг.

Короткий опис статті: англійський словник 1. Інтро. Особисте

Я готуюся до мовного іспиту IELTS (International English Language Testing System) — мабуть, самому популярному
тесту на знання англійської. Якщо хочеться емігрувати,… epub, книги, google translate api, python, англійська мова, англійська навчання мови, велосипед на ракетному паливі

Джерело: Читаємо електронні книги англійською без словників і перекладачів / Geektimes

Також ви можете прочитати