Тенёта-Ринет' 2000:

ИТОГИ

АВТОРЫ

ЦЕРЕМОНИЯ

ШОРТЛИСТЫ

РЕЗУЛЬТАТЫ ГОЛОСОВАНИЯ СЕТЕВОГО ЖЮРИ

ТАБЛИЦЫ ГОЛОСОВАНИЯ СЕТЕВОГО ЖЮРИ

Тенета-Ринет'2000: Худломер

OTЗЫВЫ:
Имя:
Текст:

type="reset" value="RESET"> OTЗЫВЫ:
Имя:

E-Mail:

URL:

Текст:


Лента
Зеленая
Сиреневая

Институт
Интервью
Объявления
ХУДЛИНКС
Конкурс переводов стихов. Призовой фонд: $150.
Конкурс РЕЦЕНЗИЙ на конкурсные работы. $300 от VirtualLogo
КОНКУРС РЕЦЕНЗИЙ на книги Дмитрия ЛИПСКЕРОВА $180 от Lipskerov.Ru
Luna.MSK.Ru: приз -
участок Луны
Сетевой Дюк
ПРИЗЫ: $950
Русская Америка
Призы: $750
ВНЕ КОНКУРСА
Обсуждение категории
АРТ-ЛИТО
Диофантов кинжал
Тенета-Ринет
КАТЕГОРИИ
НОМИНАТОРЫ
ПРОФ. ЖЮРИ
СЕТЕВОЕ ЖЮРИ
14 апреля |
ЛД
- Fri Apr 14 9:38:04 2000

Рассказы о применении OCR CuneiForm 2000:

Евгений Ворушилов
Помню, в далеком 1995 году я купил компьютер, а потом обзавелся классной штукой -
сканером. Правда, сканеры тогда были, скажем так, не очень хорошие, но выбирать
не приходилось.... потом грянули такие вещи, как кризис, падение рубля и т.д. В
общем, этот сканер до сих пор стоит у меня. Дело в том, что для делового человека
должно все быть быстро и доступно. К примеру, тебе принесли какой-нибудь
договор и сказали, что надо сделать копию с некоторыми изменениями. Не буду же
я, занятой человек, отдельно сканировать печать, набивать в изрядно надоевшем
word'е текст...

Я пойду другим путем: куплю отличный продукт от фирмы Cognitive Technologies:
CuneiForm OCR (система распознавания текстов) и просто возьму, просканирую,
включу эту программу (которая БЫСТРО это сделает) и текст готов! В отличии
зарубежных программ OCR, данная, работает намного быстрее и надежнее, что в
системе windows сделать ОЧЕНЬ сложно. К тому же есть у программы CuneiForm и
другие хорошие вещи: условно-бесплатная версия, легкость в обращении,
доступность, мощный встроенный текстовый редактор и т.д....

И я пользуюсь этой программой уже 2 месяца (что для меня не характерно). Спасибо
вам, группа разработчиков, за этот продукт!

ХУДЛОМЕР СЧИТАЕТ, ЧТО ЭТОТ ОТЗЫВ:
РАЗГОВОРНАЯ РЕЧЬХУДЛОГАЗЕТНАЯ СТАТЬЯНАУЧНАЯ СТАТЬЯ
  

Леонид Делицын
- Fri Apr 14 9:36:43 2000

Рассказ лидера конкурса CuneiForm:
Евгений Хуторов
Дело происходило в разгар перестройки, когда мы думали и надеялись, что мы
сможем все, и все сможем осилить. Институт наш академический мозгов много,
денег мало. Решили мы автоматизировать одну из областей банковской
деятельности, а именно ввод данных с платежных поручений. Вроде бы все понятно,
есть место, где написана сумма, есть место, где напечатаны банковские реквизиты.
Банк был строгий все бланки стандартные, копии платежек не принимал,
обязательно первый экземпляр на ленте средней жирности и т.д. Так, что проблем
нет, все просто все ясно и мы на коне и с деньгами. Что бы упростить еще больше
решили сделать шаблон на сканер, что бы мусора вообще не было. Испытали
огромную кучу материалов от упаковки фотобумаги до полимерных зеркал, нашли
черную садовую пленку тонкую и непрозрачную. Все отлично! Теперь для нового
тогда для нас дела презентации небходим сканер. Темной ночью через окно
режимного института нам под честное слово дали поносить на три дня
микротековский сканер. Что мы испытали пока пешком шли через весь город с
жигулями (по цене) под мышкой отдельный рассказ. И вот мы в банке. Техника
расставлена, работает, распознает, печатает список и, если хочешь, редактирует.
Директор банка в восторге, мы в восторге, и перед глазами, почему-то встает
дикая помесь из всевозможной оргтехники, лазерной техники, ваз 2106 и розовых
кальсон. Через несколько минут директор вызывает главного бухгалтера своего
банка и начинает с дрожью в голосе рассказывать о перспективах автоматизации
банковской деятельности. Пришла главный бухгалтер - знойная женщина, мечта
поэта, но на наше несчастье оказалась очень грамотным специалистом, и начала
считать. Считала так: компьютер столько, сканер столько, программа столько и
самое главное при увольнение целого зала операционисток по сокращению штатов в
течении трех месяцев она должна платить местному фонду занятости довольно
большие деньги, кроме того операционистки в большинстве своем пенсионерки и
если их уволить мы теряем льготы по налогу на всякие там надбавленные и не
надбавленные стоимости, и нужен компьютерщик, и нужен электронщик, и одним не
обойтись. Короче говоря, на эти деньги можно нанять еще кучу операционисток и
платить им маленькую зарплату чуть ли не целый год. И провели нас под белые
ручки к выходу, и поблагодарили от лица банковских служащих, и выставили вон.
Вот такая получилась у нас автоматизация, вот такая блин вечная молодость
нашей экономики, которая должна быть экономной.

Второй случай произошел со мной, когда шабашил я в благотворительном фонде
помощи самому фонду. Народ там был дремучий, и даже моих небольших знаний
хватало, чтобы быть там на очень большой высоте. После того как компьютер
заработал, самая главная моя задача заключалась в набивании списков тех людей,
которым помогают или они помогают жить хорошо моим временным начальникам.
Народ который приносил все эти списки был довольно-таки забитый и мне ни чего
не стоило заставить их приносить эти списки, напечатанные на пишущей машинке.
Надо сказать, что в фонде этом был к компьютеру подсоединен комбайн Оливетти,
который был и принтер и сканер (300 dpi, правда) и модем и факс, настоящий гроб с
музыкой и по форме похожий и пищащий по любому поводу. Уговорил я своих
начальников отдать мне этот гроб домой, естественно для увеличения
производительности труда и ускорения ввода информации. Всем хорошо у меня
дома: принтер, модем и сканер, распознает программа гораздо быстрей, чем я
печатаю, жена отправляет свои статьи на хорошей бумаге и с хорошим качеством,
деньги капают. Только вдруг заметил, что с одним из сборщиков данных кунечка
(CuneiForm - прим. ред.) работает как-то странно, распознавать - распознает, но
как-то неуверенно. Присмотрелся внимательней и обалдел: на бумаге шрифтом
печатающей машинки карандашом ТМ рукописный текст. Нет предела
возможностям человека! До сих пор жалею, что при переезде все эти бумаги
потерялись. После этого случая я уверен, что наш человек выживет везде и на
любую буржуйскую или начальственную глупость или вздорность ответит такой
изобретательностью, что….


ХУДЛОМЕР СЧИТАЕТ, ЧТО ЭТОТ ОТЗЫВ:
РАЗГОВОРНАЯ РЕЧЬХУДЛОГАЗЕТНАЯ СТАТЬЯНАУЧНАЯ СТАТЬЯ
  

Леонид Делицын
- Fri Apr 14 9:03:09 2000

Вместо "газетной статьи", видимо, следует написать "Новости" или "Информационные сообщения".


Леонид Делицын
- Fri Apr 14 8:59:50 2000

Совет: не постите сюда слишком большие тексты.

200-500 слов - достаточно. При 200 словах худломер "ошибается" влево на 10% и вправо на 10%, а при 500 - порядка 5%



Леонид Делицын
- Fri Apr 14 8:57:52 2000

Да, берется средняя длина слова.
Два других параметра, которыхе работают приблизительно так же, но дольше - это суммарная частота служебных слов и суммарная частота некоторог набора окончаний.
Однако, корреляция результатов очень велика, т.е. эти три параметра зависимы. Единственное существенное улучшение, которое можно сделать: что отсекать "неправильные" тексты, например "меню" - они не передают информации.

Хороший пример также был взят с повторением одной фразы. В принципе, можно добавить и частотный анализ и следить за тем, чтобы распределение частот было ципфовым.

Но в качестве игрушки неплохо работает и так.

Еще можно было бы в таблице четыре поля сделать не совсем одинаковой ширины (шаги между 4-мя функциональными стилями, которые я выделяю, не совсем равны. Почти равны, но не совсем).

ХУДЛОМЕР СЧИТАЕТ, ЧТО ЭТОТ ОТЗЫВ:
РАЗГОВОРНАЯ РЕЧЬХУДЛОГАЗЕТНАЯ СТАТЬЯНАУЧНАЯ СТАТЬЯ
  

InterReklama advertising