Удалённая работа | Комментарии к проекту «На перспективу (База данных графики)»
-   -
 

Войти на сайт

Забыли пароль? | Регистрация

- Проекты     Фрилансеры     Блоги     Статьи     Сервисы     Инфо-центр     Поиск -

Обратите внимание

... на каталог фрилансеров

 
 

PapaIris Оффлайн Папа Iris [PapaIris]


На перспективу (База данных графики)

Бюджет проекта не указан
Чтобы сформулировать проект - надо определиться с терминологией. Ищу грамотный совет. Полагаю, для работы понадобится программист баз данных, знакомый с работой и устройством программ для просмотра, редактирования и конвертации/распознавания графических файлов. Базу обязательно буду делать, но хочу понять, возможно ли это вообще (или, наоборот, велосипед уже изобретен и ждет...)

Имеются:
Журналы и книги в электронном виде (порядка 2000 файлов, пополняется еженедельно на 3-10 единиц). Тематика: Рукоделие.
Форматы хранения: djvu, pdf, jpg/jpeg (в папках),gif,..., rar (плюс специализированные графические форматы), должны иметь возможность встраиваться и распознаваться системой.
Нужно:
Не самое главное - сделать базу для хранения всего этого богачества на локальном компьютере. Я представляю себе пустую базу, типа Access, которую я или кто-то (потом) сможет заполнить теми материалами, которые есть, и потом пополнять ее. Цель - существенное ускорение поиска конкретного материала(ов) - страницы, картинки.

САМОЕ ГЛАВНОЕ:
1. возможность проставления тегов/комментариев (до 15) для поиска к каждой из страниц, а еще лучше - к разным частям страницы и/или распознавание текста (при отсутвии тегов или в дополнение к ним)
2. осуществлять расширенный поиск по тегам и тексту в графических страницах разных форматов.
3. При поиске должны выводиться превьюшки с zoom-ом и просто список изданий с указанием страницы.

Комментарий к ТЗ:
1. Как прототип - полнотекстовый поиск в AdobeReader - но он берет только текст и "выводит" только списком.
2. Как прототип - программы-"каталогизаторы"
3. Возможно, такая BD уже существует, и ее нужно/можно будет раскурочить и доработать - такой вариант тоже приемлем.
4. Может быть, это вообще не называется "базой данных", но в настоящий момент все эти файлы приходится открывать четырьмя разными "просмотрщиками", а добавить комментарии/теги/ключевые слова в некоторых из них невозможно. Т.е., как я понимаю, нужна некая ОБОЛОЧКА, которая позволит сделать желаемое.

Хотелось бы знать:
Реально ли это сделать?
Какой специалист для этого нужен?
Сколько времени может занять работа?
И, конечно, ... скока?

Спасибо всем, кто откликнется!

Получив ответы на свои вопросы, смогу полноценно оформить проект (с ТЗ и бюджетом)
 
 
Опубликован 24.04.2009 в 16:15 по мск
Номер ICQ: 41192550
Прошло времени с момента публикации: более 15 лет
прикреплённый файл: jpg (jpg, 295,19 Кб)

Оплата   Оплата  
 
кандидаты Просмотреть кандидатов на исполнение проекта
Исполнитель проекта: не определён
 
 
Комментарии к проекту
viair Оффлайн свободен для работы Airijan Viacheslav [viair]

24.04.2009 в 19:32 по мск

Добрый день.
Видимо Вы сами пока окончательно не представляете, что именно хотите получить.
1. Вам необходим WEB ресурс с доступом через браузер, содержащий базу данных с адресами к содержимому и каталог с самим содержимым ?
2. Или нужено оконное приложение с возможностью поиска ресурсов на локальной машине в базе данных по запросу, с последующим отображением результатов поиска посредством интерфейса приложения ?
 
 
PapaIris Оффлайн Папа Iris [PapaIris]

24.04.2009 в 21:06 по мск

Вот видите! Первая моя "невнятность"!

Видимо, это "оконное приложение" - отдельная программа для отдельной машины. Как программы - каталогизаторы.
Самая большая проблема - в "многостраничности" файлов pdf и djvu.

Если Вы это называете "содержимым" то любой каталогизатор и поиск Windows с этим справляется, найдя название файла. Но представьте, что среди 10 50-страничных файлов pdf и 20 папок с jpeg-ами есть два разных изображения, скажем, Красной Шапочки. Без подписей в тексте, что, мол, на рис.10 - Красная Шапочка. А на одной из страниц файла djvu есть текст "эта шляпка похожа на головной убор Красной шапочки". В качестве простого поиска - Мне надо найти ВСЕ изображения и текстовые упоминания о Красной шапочке.

А как именно будут храниться существующие файлы - в базе (как MS Outlook и тогда ее легко переносить и архивировать) или отдельной папке(ах) на жестком диске (так легче "достать" без запуска приложения конкретный номер конкретного издания) это, видимо, потребует отдельного обсуждения уже на этапе запуска проекта.
В идеале хотелось бы и то и другое.

Если она сможет находить сама нужные файлы в компе (а еще бы, как дополнение, на отдельных съемных носителях) - это будет еще лучше.
На первом этапе я о таком не мечтаю, но т.к. я - не программист, вероятно, эту возможность (надстройку) надо озвучить на начальном этапе...

К Интернету не имеет никакого отношения... хотя, мысль интересная...
 
 
viair Оффлайн свободен для работы Airijan Viacheslav [viair]

27.04.2009 в 19:06 по мск

Ну, организовать поиск файлов в каталогах по названию - это пожалуй самое лёгкое...

Некоторые вопросы.

1. Необходим поиск файлов по определённым ключам ( названию, расширению, времени создания и пр.. ) ?
2. Необходим парсинг содержимого *PDF *DJVU и поиск в нём ?

Касательно следующего : "Без подписей в тексте, что, мол, на рис.10 - Красная Шапочка." - это практически невозможно осуществить, т.к. поиск основан и осуществляется исключительно на сверении совпадений символьных групп, а не по образному представлению компьютером пиксельной матрицы и её последующего анализа в сравнении с неким оригиналом, он просто напросто не может знать как должна выглядеть та самая "красная шапка". (одним словом, если в документе в тегах рисунка (будь то заглавие caption или подсказка hint) нет явного упоминания о искомой лексеме "красная шапочка" то поиск в 100% случаев будет ложным.

По поводу формата хранения данных, хи можно сжимать в один файл, придумать формат хранения структуры. А зачем ? Если типизировать данные, возможно это ускорит поиск, но пропадёт возможность их редактирования без участия ПО знающего формат хранения. Тут нужно думать...
 
 

 
-   -
© 2006-2023 Free-lancers.net
Фрилансеры. Удалённая работа.
Второе дыхание - 24.04.2024 в 14:04
admin@free-lancers.net
     

Rambler's Top100
О проекте | Обратная связь