Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация Поиск О нас пишут Награды Читальня Конкурсы Опросы








ГП-цитатник

Кошка across

Сообщение across » Ср июл 12, 2006 15:06

ostro писал(а):компания across и разрабатывала свой продукт -- а я думал, что это продукт nero.


Компания across является подразделением компании Nero AG
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск





Сообщение Бродяга » Ср июл 12, 2006 15:08

across писал(а):И когда я писал, что система должна быть проста для переводчика, я подразумевал что, например, при переводе текста, мне, как переводчику совсем не надо знать что такое "тэг". Цель переводчика это перевести сущность, сам текст, а не сохранять форматирование в переведенном документе или изучать QuarkXPress для выполнения перевода.


Теперь я понял, что вы хотите сказать. И ваше мнение имеет право на существование, более того, я ему глубоко симпатизирую. Но, к сожалению, реалии таковы, что технический переводчик, не разбирающийся в тегах и многих других структурных вещах, не сможет грамотно и качественно выполнять свою основную работу - перевод. Хотя переводчиков таких очень много. Но никакая система не сможет полностью автоматизировать работу с тегами при переводе, например, с английского на русский язык. Если переводчик порушил теги, то за него их восстанавливать придётся редактору или верстальщику. Которые таких переводчиков очень не любят. И это при условии работы через БП. Прямой заказчик с таким переводчиком перестанет работать после первого порушенного тега. Может даже не заплатить.

Кроме того, переводчик, не знающий хотя бы основ программ, файлы которых он переводит (PageMaker, QuarkXpress или даже просто Word), тоже не сможет качественно выполнить свою работу.
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение ostro » Ср июл 12, 2006 15:08

спасибо за уточнение. а на остальные вопросы (в плане сравнения с традосом) будут ответы? может быть, вы поговорите по этому поводу внутри своей компании, если вы сами не осведомлены... нам же интересно знать...
ostro

 
Сообщения: 989
Зарегистрирован: Сб мар 19, 2005 15:31
Откуда: москва

Сообщение across » Ср июл 12, 2006 15:25

Бродяга писал(а):Кроме того, переводчик, не знающий хотя бы основ программ, файлы которых он переводит (PageMaker, QuarkXpress или даже просто Word), тоже не сможет качественно выполнить свою работу.


Тут я не совсем согласен. Принцип обработки документов в across следующий: документ загружается, анализируется, из документа across выделяет только то, что является текстом, то, что действительно необходимо переводить. Переводчик переводит соответственно только тексты. Если не будет большого нарушения по длине исходной фразы -> перевод, то вообще никаких проблем - после того как весь текст переведен, он выгружается в формат исходного документа, заменяется только исходный текст. Если же при выгрузке документа из across был нарушен формат, то это уже ошибка программы, которую максимально быстро устраняют разработчики. Остается, конечно же, часть работы, если в документе содержатся иллюстрации, текст из которых не был загружен, но тут уже встает вопрос о разделении работы переводчика и дизайнера, об организации процессов работы.
Добавить сюда, что среда для перевода не зависит от загружаемого формата, что также облегчает работу.
Вот мы и получили основу для упрощения процесса перевода, Вам необходимо быть специалистом в области перевода, а не специалистом в программах, в которых создавался документ.
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение Бродяга » Ср июл 12, 2006 15:36

То есть, насколько я понял, переводчик у вас тегов вообще не видит. Но хотя бы включить их отображение можно? А то совсем грустно. Элементарные теги (жирный шрифт) могут ездить по предложению как угодно. Некоторые теги (амперсенд) вообще могут совершенно легально пропадать при переводе на русский язык. А что если сам тег или его часть нужно переводить? Пример - гиперссылки и img alt в HTML. Про работу с суровыми форматами (XML, например) я вообще промолчу. У вас DTD поддерживаются?
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение across » Ср июл 12, 2006 15:36

ostro писал(а):спасибо за уточнение. а на остальные вопросы (в плане сравнения с традосом) будут ответы? может быть, вы поговорите по этому поводу внутри своей компании, если вы сами не осведомлены... нам же интересно знать...


Мне самому очень интересно знать, но для того, чтобы выполнить хороший и тщательный анализ между системами я считаю, что необходимо разработать критерии сравнения, затем собраться специалистам и по разработанным критериям уже выполнять оценку. Я думаю, что это очень трудоемкий процесс. Если учесть, что системы постоянно обновляются, то к тому времени как толковый анализ будет выполнен, системы изменятся настолько, что он будет неактуален.
Мы можем поступить немного по другому, если Вы желаете - назовите мне неудобства CAT системы, которой Вы пользуетесь, возможно, они уже решены в across. Все пожелания, которые не решены и действительно являются неудобствами, я передам в отдел разработчиков, возможно, они будут включены в план работ.
Ну и если действительно интересует обзор всех основных систем, Вы можете найти книгу "Translation Memory Systeme im Vergleich" Massion, François, там сделан анализ на 300 страниц.
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение across » Ср июл 12, 2006 16:09

Бродяга писал(а):То есть, насколько я понял, переводчик у вас тегов вообще не видит. Но хотя бы включить их отображение можно? А то совсем грустно. Элементарные теги (жирный шрифт) могут ездить по предложению как угодно. Некоторые теги (амперсенд) вообще могут совершенно легально пропадать при переводе на русский язык. А что если сам тег или его часть нужно переводить? Пример - гиперссылки и img alt в HTML. Про работу с суровыми форматами (XML, например) я вообще промолчу. У вас DTD поддерживаются?


Да, при переводе across пытается отображать только текст. Иногда, в сложных структурах, например при переводе XML (XML бы сгенерирован из MSI для перевода), некоторые объекты XML в тексте отражаются как fields (например "Вы действительно хотите установить [field] на выбранный компьютер?"). Программа across в данном случае следит, чтобы все fields из исходного предложения были представлены в конечном предложении.
Элементарные тэги (например, жирный текст в Word) если он встречается в предложении-оригинале и не может быть выделен в самостоятельный сегмент - across при вводе текста предоставит Вам используемые в сегменте стили и Вы, как и в Word, просто выделите необходимый текст и выберите требуемый стиль.
Если across "съела" что-то лишнее, в зависимости от типа документа Вы можете настроить правила анализа (но это уже для очень продвинутых пользователей).
HTML across анализирует "не очень" в версии 3 (я пытался скормить ей сложные HTML и HTML с не закрывающимися тэгами, система некоррекно определяла текст), но к концу года планируется версия 3.5, в которой HTML работает в разы корректней. А то, что заставляют переводить HTML - я считаю некорректно. Если это сайт, которому действительно нужна локализация, значит у сайта должна быть CMS. А если есть CMS, то можно выгрузить контент в какой-то формат (не HTML). При этом понятно, что переводчику выбирать не приходится - есть задача, как ее поставил заказчик.
Суровые форматы как XML (опять же при локализации across из всех MSI получали структуру в XML, потом локализовывали XML) - я проблем с XML не увидел.
DTD? Сейчас, к сожалению, человека кто мог бы ответить на этот вопрос нет на месте, поэтому у меня один ответ - попробуйте. Что-то делали, насколько все работает - я не знаю, если не работает - разберемся :-)
Судя по тому, что across использует ряд крупных немецких компаний - производиьтелей, я думаю научить across переводить можно практически любой формат, нужно только время. А пока что форматы, которых не хватает немецким компаниям - дописываются промежуточные форматы, например в тот же XML.
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение Gleb Lepeshkin » Ср июл 12, 2006 16:49

Сорри за оффтоп.

Глеб, ох, ну кто вам сказал, что, например, я работаю по ставке 6 уев. Не надо выдумывать.


Андрей, когда я говорил про ставку 6 дол. я на вас не ссылался. Я говорил про те ставки, которые заявлены агентствами в Инете.

Кроме того, не стоит забывать, что далеко не у всех синхронистов такие ставки, как у Андрея (ostro) и такие клиенты, который готовы платить эти деньги. Практически уверен, Глеб, что вы не работаете за 400/день, чего уж там.


Ну раз вас так и тянет перейти на личности, скажу что за день работы я чаще беру больше, чем 400 уев в день. Конечно, лукавить не буду -- такая работа не каждый день бывает. Но и ездить на "колясках" меня не заставляют. Просто есть клиенты, которые заинтересованы именно во мне и готовые платить и довозить меня до места переговоров.

Да и вообще, Глеб, если вы думаете, что устный переводчик хоть чем-то круче письменного, как это у вас проскальзывает, то вы глубоко заблуждаетесь.


Нравиться вам по клаве стучать 8 часов в день -- дай Бог!
Аватара пользователя
Gleb Lepeshkin

 
Сообщения: 780
Зарегистрирован: Ср мар 29, 2006 20:21
Откуда: Samara
Язык(-и): Eng-Rus

Сообщение Бродяга » Ср июл 12, 2006 16:51

Ну, теперь ситуация более-менее прояснилась. Насчёт того, корректно или некорретно заставлять переводить HTML, я спорить не буду. Скажу только, что это один из самых лёгких форматов для перевода, с которым мне приходилось сталкивать. В силу ряда причин предпочитаю работать с ним в DejaVu. Хотя несколько лет назад делал огромный HTML-ный проект в Ворде (через ITP FIlter Pack) ТРАДОСом.

А вот насчёт [field] в XML - несерьёзно это как то. А что, если этот [field] надо переводить? А XSL заказчик "забыл" прислать?
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение across » Ср июл 12, 2006 17:15

Бродяга писал(а):А вот насчёт [field] в XML - несерьёзно это как то. А что, если этот [field] надо переводить? А XSL заказчик "забыл" прислать?


А вот тут уже используются «правила определения» что является текстом, а что - нет. В случае, когда правилами не решатся вопрос - делать конвертер в более "понятные" форматы.
И опять же – если есть большой объем переводов, в котором действительно необходимо использовать CAT и этот объем постоянен, что проще делать? Потратить на написание конвертора 1 день – 1 неделю и потом переводить просто текст, не разбирая форматы (значительно увеличив производительность). Или же каждый раз разбираться, что переводить, а что нет?
Я понимаю, что специфика рынка такова, что клиент может прислать что хочет и как хочет, но с таким подходом невозможно поставить перевод «на поток» и я не представляю себе алгоритмов которые при таком подходе могут упростить перевод.
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение Бродяга » Ср июл 12, 2006 17:29

Мне присылают, что хотят (кроме разве что сканов). Никаких проблем с потоковым переводом я не испытываю. Просто надо знать, когда что использовать.

"Неразбирание форматов" крайне редко ведёт к увеличению производительности. Но всегда ведёт к значительному снижению качества работы.
А потом уже поздно было редактировать. © bagira:)
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение across » Ср июл 12, 2006 17:40

И еще размышления немного не по теме:
Я не имею опыта переводчика, не знаком с материалами, которые присылаются заказчиком, но попробуй предположить. Стоимость перевода зависит от объема переводимого материала, считается количество слов. Если мне заказчик присылает задание на перевод статьи, я оцениваю стоимость по количеству слов в статье. Но если заказчик мне присылает на перевод статью, в изображении (фотография например, или отсканированный материал, или PDF) и на вопрос «А где же исходный материал?» я не получу действительно исходного материала (текста в Word, txt, графический векторный формат), то смею предположить что цена перевода будет складываться из стоимости обработки входного материала в исходный материал перевода, а затем только количества слов.
Я считаю что аналогия с «нестандартными» форматами, форматами для которых заказчик не прислал XSL тут прямая, потому что в конечном счете стоимость работы выразится не в количестве переведенных слов, а в количестве потраченных часов.
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение across » Ср июл 12, 2006 17:48

Бродяга писал(а):Мне присылают, что хотят (кроме разве что сканов). Никаких проблем с потоковым переводом я не испытываю. Просто надо знать, когда что использовать.

"Неразбирание форматов" крайне редко ведёт к увеличению производительности. Но всегда ведёт к значительному снижению качества работы.


Т.е. если я Вам предоставлю на перевод Word или жутко навороченный графический векторный формат, то скорость будет у Вас абсолютно одинаковая? Я сомневаюсь...

Ну и по поводу хитрых XML форматов, всегда можно сделать следующее если очень хочется видеть все тэги: загрузить XML без разбора тэгов и переводить (память переводов и терминология) останутся. Но это уже из разряда "использовать не по назначению".

"Просто надо знать, когда что использовать" - замечательная фраза, вот как раз это across и пытается устранить. Не надо думать, что когда использовать, есть единая база памяти переводов, единая терминология, которые накапливаются и являются отражением Вашего опыта. Просто переводите любые форматы.

Так или иначе, огромное спасибо что обратили внимание на такую особенность, записал, будем обсуждать :grin:
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение greberl. » Ср июл 12, 2006 18:03

across писал(а):Ключ выдается только на странице http://www.across.net/de/fdb_intro.aspx. И выдавался он на этой странице только членам ассоциации BDÜ (Bund Deutscher Übersetzer).

Тут у Вас неверная информация. Получают ВСЕ фрилансеры вне зависимости от членства в этой ассоциации. Уверенность 100 %. :-)
"Military justice is to justice what military music is to music." (c) Groucho Marx
Аватара пользователя
greberl.

 
Сообщения: 714
Зарегистрирован: Сб май 28, 2005 20:04
Откуда: Германия

Сообщение greberl. » Ср июл 12, 2006 18:05

nstar писал(а):А для нечитающего по-немецки можете объяснить, где что нажать надо, чтобы получить программу и ключ?

Это Вам ничего не даст, т.к. программа тоже на немецком.
"Military justice is to justice what military music is to music." (c) Groucho Marx
Аватара пользователя
greberl.

 
Сообщения: 714
Зарегистрирован: Сб май 28, 2005 20:04
Откуда: Германия

Сообщение across » Ср июл 12, 2006 18:10

greberl. писал(а):Это Вам ничего не даст, т.к. программа тоже на немецком.


Система across существует на немецком, английском и русском
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение greberl. » Ср июл 12, 2006 18:15

across писал(а): Система across существует на немецком, английском и русском


А бесплатный ключ работает со всеми версиями?
"Military justice is to justice what military music is to music." (c) Groucho Marx
Аватара пользователя
greberl.

 
Сообщения: 714
Зарегистрирован: Сб май 28, 2005 20:04
Откуда: Германия

Сообщение across » Ср июл 12, 2006 18:39

greberl. писал(а):
А бесплатный ключ работает со всеми версиями?


Ключ, который подходит к английской версии, подходит и к русской. С немецкой версией мы не сталиваливались, подходит ли от нее ключ я не знаю.
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Сообщение Бродяга » Ср июл 12, 2006 18:41

across писал(а):Не надо думать, что когда использовать, есть единая база памяти переводов, единая терминология, которые накапливаются и являются отражением Вашего опыта. Просто переводите любые форматы.

При наличии единой накопленной базы и терминологии думать действительно не надо.

Только вот у меня баз и терминологий много, для каждого заказчика своя. Да и база для перевода HTML не будет на 100% подходить для перевода того же текста в Word. И никак это не обойти. Универсальность возможна только для крайне примитивных текстов. Для обеспечения реального качества к каждому формату нужен свой подход.

Могу ещё добавить, что нужен свой подход к каждому заказчику, присылающему на перевод, например, документы в Word. Одно дело, если это европейская компания, но совершенно другое - когда азиатская. Никогда не буду переводить их в одну базу. Иногда даже приходится применять разные программы. Надеюсь, что вы понимаете, о чём идёт речь.

А насчёт "загрузки XML без разбора тегов" вы зря сказали. Не делают так. Для любого XML необходим DTD. Если его нет, то переводчик должен его сделать сам. Или отказаться от заказа.
Аватара пользователя
Бродяга

 
Сообщения: 4948
Зарегистрирован: Ср дек 07, 2005 13:34

Сообщение across » Ср июл 12, 2006 19:21

Бродяга писал(а):Только вот у меня баз и терминологий много, для каждого заказчика своя. Да и база для перевода HTML не будет на 100% подходить для перевода того же текста в Word. И никак это не обойти.

Ну, тут мы немного не понимаем друг друга в терминологии, across использует одну базу данных для хранения всего, каждая занесенная запись просто записывается дл определенного проекта, заказчика, темы. Далее Вы просто настраиваете фильтры...
Бродяга писал(а):Универсальность возможна только для крайне примитивных текстов. Для обеспечения реального качества к каждому формату нужен свой подход.

Неужели все заказы, которые приходят, имеют свой формат? Каждый заказчик придумывает свой уникальный формат? Или тот же формат XML настолько не соответствует спецификации? Да, есть наверняка свои форматы, несоответствие спецификации, но я очень сомневаюсь, что это большинство задачек. Более того, я думаю что большинство - это обычные Word, Excel, PowerPoint, HTML, XML, exe, dll ....
Если у Вас действительно большинство заданий для "уникальных" форматов, то да, across Вам не подойдет.

Бродяга писал(а):Могу ещё добавить, что нужен свой подход к каждому заказчику, присылающему на перевод, например, документы в Word. Одно дело, если это европейская компания, но совершенно другое - когда азиатская. Никогда не буду переводить их в одну базу. Иногда даже приходится применять разные программы. Надеюсь, что вы понимаете, о чём идёт речь.

К сожалению, не понял о чем речь, наверное, опять из-за различия организации хранилища для памяти переводов. across позволяет хранить любые языки в одной базе без всяких проблем.
Применять разные программы? Опять же, я против. Ладно, Вы работаете фрилансером, у Вас не спрашивают лицензии. Серьезное бюро я думаю, не может себе позволить существовать без лицензий, при этом, для того чтобы переводить все форматы для всех языков надо покупать разные программы, учиться разным программам? А если здесь еще учесть командную работу, то надо для каждой программы покупать отдельные сервера, цена еще вырастает, обслуживание...
Идеализирую, наверное, но надеюсь, что across поддерживает бОльшую часть форматов и справляется с задачей не хуже, чем другие программы. Мне уже самому стало интересно про "хитрые" форматы, можно какие-то примеры от Вас получить?
Бродяга писал(а):А насчёт "загрузки XML без разбора тегов" вы зря сказали. Не делают так. Для любого XML необходим DTD. Если его нет, то переводчик должен его сделать сам. Или отказаться от заказа.

Нда, тут я не то сказал. DTD действительно across поддерживается для загрузки и анализа документа, но вот переводить DTD с помощью across - вот в чем у меня были сомнения. Видимо к концу рабочего дня моя голова отключилась.

Бродяга, я Вам предлагаю просто попробовать поставить across, может быть, Вы после этого выкинете половину софта, чтобы решать задачи в одной программе, а не использовать несколько? :lol:
across

 
Сообщения: 57
Зарегистрирован: Ср фев 01, 2006 13:20
Откуда: Новосибирск

Пред.След.


Словари русского языка

www.gramota.ru
Словарь Мультитран
Язык

Вернуться в Across

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 5