Яндекс.Метрика Ёфикация книг цикла

Цитадель Детей Света. Возрождённая

Цитадель Детей Света. Возрождённая

Новости:

Потеряли галерею, шахматы и все файлы-вложения, если вы когда-то грузили их на сервер

Ёфикация книг цикла

Автор Лопар, 07 июля 2015, 21:13

« назад - далее »

Лопар

Так исторически сложилось, что некоторые из книг цикла оказалась "Ёфицированными". "Память Света" - переведённые главы - полностью, "Возрождённый Дракон" - первая половина, "Грядущая буря" и "Башни полуночи" - частично, некоторые слова. Мне, лично, идея понравилась, всё-таки буква "Ё" - неотьемлемая часть русского языка, и книги с ней выглядят гораздо приятнее. Но, раз уж взялись, нужно доделывать до конца, и, видимо, и для других книг тоже. К проблеме вычитки добавилась и эта, весьма трудоёмкая беда.

У меня уже есть небольшая наработка, могу ей поделиться, авось кому пригодится, а может быть, и кто-нибудь что-нибудь лучше предложит. Не, ну мне попадалась на глаза "интеллектуальная программа Ёфикации", как приложение к независимому пакету по проверке орфографии, примочка к MS Office. Но этот пакет стОит немеряно бабла, да и в особую "интеллектуальность" я не верю, особенно - для книг этого цикла. Очень многое в русском языке зависит от контекста, склонений, спряжений и т.п. А если на каждом шагу идут слова, не знакомые "проверке орфографии", такие, что "проверка грамматики" не может определить, какая это часть речи? Да и та же самая "Принятая" - как эта прога поймёт, что это существительное женского рода, а не что-то иное? На какую "интеллектуальность" тут можно надеяться?

Моя идея состоит в создании "базы" из слов, корней и "кусков" слов с буквой "Ё". И дальше, поочерёдно, по порядку, берутся слова из базы и процедурой "Найти - Заменить" прочёсывается вся книга от начала до конца по каждому слову. Процесс туповатый и муторный, но даёт лучшие результаты, чем простая вычитка, при которой неизбежны "зевки". И, уважаемые переводчики, даже если перевод сразу "Ёфицируется", гарантии от "зевков", увы, нет.

Например, слово, корень или бог знает что: "вёл". Поиск как "слово целиком" вести нельзя, возможны всякие "увёл", "завёл" и т.д. А попутно попадаются "вела", "привела", "Великий Повелитель" и много прочего "мусора". Приходится перелопатить тонны "пустой породы", чтобы найти несколько попаданий. И не дай бог нажать "заменить все"!
Ещё хуже со словом "всё". Может быть "все", "всём", "всем" - нужно смотреть по контексту. И по пути "спотыкаться" об "всех", "всего", "совсем" и прочую "непотребщину". Может быть имеет смысл зарядить "всё" и "всём" как "слово целиком"? Тогда "пустой породы" не будет, только контекстная проверка, но что-то не могу представить последствия, вдруг пропущу какие-нибудь слова, башка не варит.
Слово "жён" тоже тяжкое. Может быть и целиком, и "жёны", а также "раздражён", "вооружён" и т.д. с вариациями. А уж "шлака" встретится...
То ли дело "её" и "Её"! Зарядить "слово целиком", "с учётом регистра" и "заменить все" - 2 минуты делов!

Попутно, по ходу прочёсывания, высматриваем слова, не включённые в базу, и добавляем в не сортированную часть ниже основной базы.

Имеющиеся сейчас слова базы набраны по ходу вычитки книг "Новая весна", "Око Мира", "Великая Охота". А ниже базы - те слова, которые мне пока что попались по ходу вычитки книги "Возрождённый Дракон". После прохода этой книги придётся вернуться к предыдущим книгам и проверить их на "новые" слова, вдруг они там были, а я прозевал (прецеденты на прошлых циклах бывали неоднократно). А потом сделать сортировку базы по алфавиту и браться за следующую книгу... С последующим возвращением к предыдущим... И, естественно, в каждой книге будут не все слова из базы, так что "пустые проходы" гарантированы. Так, слово "дядьёв" попадалость пока только в "Новой весне", но проверяю на него и остальные книги. А вдруг...

Вот, вкратце, как-то так.

Сейчас попробую загрузить файл, ни разу ещё не делал, так что, результат не гарантирую.

P.S. Я пока работаю только с txt, переходить на более "продвинутый" формат буду не скоро. А кому надо срочно, да ещё с курсивом и картинками - могут сами попробовать свои силы в этом нелёгком деле.

Лопар

Сразу - вопрос!
Как правильно: "перед платья" или "перёд"?

Луан

Перед, насколько я помню.
Луан
Все черепа скалятся, но этот выглядел особенно счастливым.
Дж. Мартин. Танец с драконами

Законы всемирного свинства едины для всех и каждого
А. Пехов. Вьюга Теней

hrIch

Мною уже отёфицирована большая часть книг цикла, осталось подовычитывать чутка - сейчас застрял на книге "Нож Сновидений" в ЦДСовском переводе - и внести правки в несколько уже вычитанных книг.
А для работы советую использовать Yo - ложные срабатывания бывают, но их крайне мало, при последующей вычитке легко устраняются...

Луан

"Нож Сновидений" в ЦДСовском переводе нужно вычитывать, одной ёфикацией там не обойтись.
Луан
Все черепа скалятся, но этот выглядел особенно счастливым.
Дж. Мартин. Танец с драконами

Законы всемирного свинства едины для всех и каждого
А. Пехов. Вьюга Теней

hrIch

Вот я и вычитываю в меру возможностей... Диалоги в норму привёл, но там по тексту такая куча пунктуационных ошибок((( В стилистику лезу только в самых тяжёлых случаях.

hrIch

Кстати, совсем забыл поделиться трудами своими... АСТовские издания в меру сил вычитаны на наличие OCR-ошибок, ёфицированы. Стилистика и сам перевод - редакции не подвергались. Приснопамятный перевод третьей книги цикла не осилил, рекомендую пользоваться трудами DarkLeopard.
В переводе ЦДС вычитаны все книги, но правки внёс только в 11 и 12, а вот в оставшихся застрял на подготовке списка предлагаемых мною правок... :(
АСТ: 1-2, 4-11
ЦДС: 11-12