je voudrais mettre en ligne des archives de vieux journaux (beaucoup d'archives) et proposer un moteur de recherche qui traitera le contenu de l'ensembles des articles.
Donc je scanne mes pages de journaux et j'utilise un logiciel de reconnaissance de caracteres. D'ou ma premiere question quel logiciel connaissez vous pour ceci (ocr je crois) ?
Ensuite deux solution je met mes articles soit au format html soit au format pdf (preference pour pdf). Seulement voila existe-t-il des script php pour realiser un moteur de recherche sur du contenu pdf ?
Je ne suis pas un pro en php mysql mais je connais un peu le langage, donc je cherche un scripts de moteur de recherche tout pret que je modifie par la suite.