Адрес для входа в РФ: exler.world
Программа называется Microsoft Office Document Imaging и находится в папке "Средства Microsoft Office". (Если компонент не установлен, то Office при первом запуске программы попросит дистрибутивный диск, чтобы его установить.)
Я потестировал - вполне понравилось.
Что классно, при распознавании текст сохраняется в достаточно простом формате (удобном для дальнейшей обработки), и программа старается сохранять только варианты начертания - например, полужирный и курсив. Картинки сохраняются в отдельной папке.
Вот, например, текст Word, полученный после сканирования простого листочка - текст.
Потестировал и на более сложной задаче - журнальный лист в несколько колонок с иллюстрацией: вот отсканированный лист, вот распознанный документ.
Раньше для решения подобной задачи я пользовался Abbyy FineReader HomeEdition (он, в отличие от FineReader Pro, стоит вполне разумных, а не совершенно заоблачных денег). Но у этой версии есть серьезные недостатки, главный из которых - жесткое сохранение формата оригинального текста (и это в Home-версии не настраивается), в результате чего его потом обрабатывать в Word крайне сложно, потому что сначала нужна убирать все эти бесконечные таблицы, настройки абзацев, шрифтов и так далее. Ну и со сканированием (а точнее - с сохранением результатов распознавания) многостраничных документов там тоже большие проблемы - все это делается весьма неудобно
В данном же случае программа, с одной стороны, простенькая, но с другой - делает все что нужно, причем быстро и удобно.
"А пацаны-то и не знают" (с)
Основные тематики каталога следующие:
- Anti-Spyware/Anti-Virus/Anti-Rootkit/Security Freeware Utilities
- Audio/Music/MP3/Real/Wav Freeware Utilities
- Business/Office/Access/Excel/Word Freeware Utilities
- Communication Freeware Utilities
- Desktop Freeware Utilities
- Editors/Notepad Replacements Freeware Utilities
- Files and Folders Freeware Utilities
- Financial Freeware Utilities
- Graphics/Images/Photographs Freeware Utilities
- Information/Fun/Misc Freeware Utilities
- Internet Freeware Utilities
- Keyboard Freeware Utilities
- Performance/Recovery/System/Tuning Freeware Utilities
- Productivity Freeware Utilities
- Programming Freeware Utilities
- Uninstaller Freeware Utilities
- Video/DVDs Freeware Utilities
- Windows Explorer Replacements/Shell Extensions Freeware Utilities
- Corrections
1. Запускаем regedit.
2. Лезем в раздел реестра: HKEY_LOCAL_MASHINESYSTEM
3. Видим там несколько разделов ControlSet с номерами (например
ControlSet001 и ControlSet003) - нам нужен тот, у которого самый большой из
всех номер!
4. Далее лезем в Control ProductOptions
5. Там в версии Home есть параметр ProductSuite типа "мультистроковый
параметр" со значением Personal - его нужно удалить и взамен него создать
там же параметр с именем Brand типа "DWORD" со значением равным нулю!
6. Закрываем Regedit и перегружаем машину - при загрузке жмем F8 и входим в
меню выбора варантов загрузки и выбираем тот что "загрузка в последней
удачной конфигурации"
7. Вот собственно и все - как только увидите при загрузке надпись Windows XP
Professional - значит все получилось!
8. Чтобы переделать XP Pro в Home - нужно ключи поменять в обратной
последовательности!
Пацаны данному обстоятельству почему-то удивляются, а некоторые из них говорят, что, дескать, MS бы только бабла срубить и все такое...
Мне непонятно, чему тут удивляться. На мой взгляд, это вполне логично. И подобная технология применяется давно, причем не только в программных продуктах. Например, как известно, трехдюймовые дискеты высокой плотности отличались от дискет двойной плотности только наличием второй дырки справа. Пленка была одна и та же - технологически было выгоднее делать одинаковую пленку для двух форматов. И знающие люди просто пробивали вторую дырку в DD, получая таким образом HD.
Так что все четко и при чем тут "бабла срубить"?
Когда я выяснил, что глюки связаны с одним и тем же процессом, название которого в списке задач мне ничего не говорило, на всякий случай стал проверять компьютер антивирусами и антитроянами - вдруг все-таки что-то влезло, хотя это весьма маловероятно.
Ну а потом выяснил, что же это был за процесс - Microsoft Antispyware. Он глючил. Пришлось сносить, я все равно Ad-Aware использую.
Кстати, MS не так давно выпустил какой-то новый сервис по безопасности Windows Defender. Никто не ставил? У меня пока руки не дошли. Впрочем, работает он только на лицензионно чистых версиях, так что вряд ли кто-нибудь ставил ;)
Однако у байесовских фильтров, учитывая технологию их работы, есть определенные особенности: график эффективности при обучении сначала растет, затем достигает максимума (когда - зависит от скорости обучения, то есть количества и качества скармливаемых ему писем), а потом начинает заметно снижаться. По крайней мере, именно так было у меня. Я этот фильтр поставил, настроил, обучил, далее какое-то время он у меня работал вполне качественно, но в последнее время (несколько месяцев) стал довольно часто скидывать в спам вполне нужные письма. Попытки "дообучения" к нужному эффекту не привели.
Тогда я, вместо того чтобы снести всю базу и обучать фильтр заново, решил попробовать другой байесовский фильтр, который также имеет плагин для Бата - вот этот. Принцип работы у него точно такой же, как и у Виноградовского: устанавливаете, делаете настройки под себя и обучаете, скормив несколько тысяч спамерских писем и несколько тысяч неспамерских (обучать надо обязательно по двум категориям, иначе будут заметные перекосы).
Поставил, обучил. В настройках заметил несколько возможностей, которых нет у предыдущего фильтра: гибкая система работы с черными списками DNS (правда, я этим не пользуюсь), фильтр с регулярными выражениями и более удобная работа с черными и белыми списками.
Пока полет вполне нормальный: безусловный спам ловит без проблем, неспам, который тот фильтр считал спамом, не трогает. В понедельник протестирую на стандартном потоке в пару тысяч писем, после чего поделюсь впечатлениями.
Кстати, если кому-то нужна батовская папка со спамом (2000 писем) для обучения какого-нибудь байеса - welcome: вот она (6 мегов в архиве, в развернутом виде 23 мега - это спам, который пришел на совершенно различные мои адреса).
Короче говоря, QIP - рулез. Все остальное - маст дай.
А как хорошо все было реализовано в PC-Shell и XTree! Все по интуитивно понятным хоткеям! Копирование - через "С", перемещение - через "M" и так далее. Никаких тебе дурацких F5 и F6... Ну почему у нас этот Norton стал популярным, ну почему? Столько лет прошло, а все из-за него мучиться...
У нового HDDLife появились две интересные фичи: во-первых, он теперь показывает, сколько лет, дней и часов проработал данный диск (это может быть особенно интересно в случае покупки ненового компьютера, да и нового тоже), а во-вторых, умеет уменьшать уровень шума винчестера (за счет незначительного падения производительности).
После статьи, где описывалась понравившаяся мне программа All My Movies, пришло несколько писем с вопросами, почему я предпочел ее программе Ant Movie Catalog, которая, дескать, значительно круче. Объясняю. Ant Movie Catalog мне не понравилась, потому что: 1. Вообще не умеет считывать данные с диска - количество субтитров, видеопоток и так далее. Ни в режиме DVD, ни в режиме MPEG-4. 2. Соответственно не умеет делать скриншоты. 3. Не имеет в базе поля, где можно четко указать местонахождение диска в коллекции. 4. Жанр описывает только одним полем, без поджанров. 5. Нельзя поставить свои собственные метки для дальнейшего отбора. 6. Нельзя создать собственные произвольные поля. 7. Кому отдано - вписывается крайне примитивно. 8. Размер картинки с обложкой менять нельзя. 9. Нет поля "нужно заказать" и "просмотренный/не просмотренный". Разумеется, кому-то вышеперечисленное может быть совершенно не нужным. А мне нужно позарез. Поэтому Ant Movie Catalog не подходит. А All My Movies - вполне. Да, согласен, Ant Movie Catalog более гибко считывает информацию из Интернета - благодаря настраиваемым скриптам. Но это единственный его плюс (с моей точки зрения, разумеется). И AMM без настраиваемых скриптов тоже ищет и выдает все что мне нужно. Кто хочет и может меня разубедить - разубеждайте. У меня задача найти оптимальную программу.