<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
	<title>Prépa &amp; else</title>
	<link>http://pgonsolin.free.fr/</link>
	<language>fr</language>
	<description>Mon bazard à propos de la prépa</description>
<atom:link xmlns:atom="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://pgonsolin.free.fr/feed.php" />
	<lastBuildDate>Fri, 17 May 2013 16:48:00 CEST</lastBuildDate>
	<generator>PluXml</generator>
	<item>
		<title>Comment créer un pdf oceriser ?</title> 
		<link>http://pgonsolin.free.fr/index.php?article3/comment-creer-un-pdf-oceriser</link>
		<guid>http://pgonsolin.free.fr/index.php?article3/comment-creer-un-pdf-oceriser</guid>
		<description>Voilà vous avez déjà du voir que sur les livres de google books on pouvant sélectionner le texte, alors que le pdf contenait une image, je vais vous expliquer comment faire.&lt;br&gt;&lt;br&gt;

Il faut installer exactimage, et tesseract ou tout autre ocr qui fournit le format hocr en sortie&lt;br&gt;&lt;br&gt;

Puis créer un fichier &quot;config&quot; vous mettez dedans &quot;tessedit_create_hocr       T&quot; c&#039;est tout, vous enregistrez&lt;br&gt;&lt;br&gt;

puis en ligne de commande mettez:&lt;br&gt;&lt;br&gt;
&quot;tesseract votre_fichier_a_oceriser output config&quot;&lt;br&gt;&lt;br&gt;
puis enfin:&lt;br&gt;&lt;br&gt;
&quot;hocr2pdf -i votre_fichier_a_oceriser -o le_nom_du_pdf_que_vous_creez.pdf &lt; output&quot;&lt;br&gt;&lt;br&gt;

Et vous vous retrouverez avec un pdf oceriser</description>
		<pubDate>Fri, 17 May 2013 16:48:00 CEST</pubDate>
		<dc:creator>pul</dc:creator>
	</item>
	<item>
		<title>Affichage d&#039;arbre en Ocaml</title> 
		<link>http://pgonsolin.free.fr/index.php?article2/affichage-d-arbre-en-ocaml</link>
		<guid>http://pgonsolin.free.fr/index.php?article2/affichage-d-arbre-en-ocaml</guid>
		<description>&lt;p&gt;Salut les amis, me re-voilà&lt;/br&gt;
Voici ma dernière invention : alors en fait comme en prépa je me suis dit qu&#039;on utilisé beaucoup les arbres en Ocaml ben moi je voulais les visualiser, donc je me suis fait une petite librairie pour les afficher :&lt;/br&gt;&lt;/br&gt; &lt;a href=&quot;http://pgonsolin.free.fr/data/documents/arbre.ml.html&quot;&gt;Voici le fichier&lt;/a&gt; &lt;/br&gt; &lt;/br&gt; Pour ceux qui se demandais comment garder la coloration syntaxique d&#039;emacs quand on affiche une page savec du code sur le web et ben c&#039;est trés simple il suffit d&#039;installer l&#039;extension emacs &quot;htmlize&quot; puis ouvrir son fichier dans emacs et faire : Alt x htmlize-buffer &lt;/br&gt; puis d&#039;enregistrer le courant document&lt;/p&gt;</description>
		<pubDate>Fri, 31 Aug 2012 20:29:00 CEST</pubDate>
		<dc:creator>pul</dc:creator>
	</item>
	<item>
		<title>Numériser des livres</title> 
		<link>http://pgonsolin.free.fr/index.php?article1/numeriser-des-livres</link>
		<guid>http://pgonsolin.free.fr/index.php?article1/numeriser-des-livres</guid>
		<description>&lt;p align=center&gt;&lt;img src=&quot;http://pgonsolin.free.fr/data/images/scan.jpg&quot;/&gt;&lt;/p&gt;&lt;p&gt;Comme le fait google actuellement avec son service &lt;a href=&quot;http://books.google.fr/&quot;&gt;google books&lt;/a&gt; Vous pouvez vous aussi vous lancer dans l&#039;aventure de la numérisation de livres.&lt;br/&gt;&lt;br/&gt;
Alors dans ce cas j&#039;ai quelque conseil à vous donner:&lt;br/&gt;&lt;/p&gt;
&lt;h4&gt;&lt;b&gt; Si vous souhaiter sumériser un livre&lt;/b&gt;&lt;/h4&gt; (si vous avez déjà numériser le livre vous pouvez passer et aller directement &lt;a href=#partie2&gt;ici&lt;/a&gt;) &lt;br/&gt;&lt;p&gt;
- Beaucoup de gens utilisent des appareils spéciaux pour numériser des livres, mais bonne nouvelle pour vous ce sont des machines simples à construire, regardez sur ce site : &lt;a href=&quot;http://www.diybookscanner.org/forum/index.php&quot;&gt;www.diybookscanner.org&lt;/a&gt;&lt;br/&gt; ou ici : &lt;a href=&quot;http://www.instructables.com/id/Bargain-Price-Book-Scanner-From-A-Cardboard-Box/&quot;&gt;www.instructables.com&lt;/a&gt;&lt;br/&gt;
- Vous pouvez aussi tout simplement prendre des photos 2 pages par deux avec votre appareil photo &lt;br/&gt;
- Il vous est aussi possible de numériser votre livre grâce à un scanner, dans ce cas là un logiciel comme &lt;a href=&quot;https://sourceforge.net/projects/gscan2pdf/files/gscan2pdf/&quot;&gt;gscan2pdf&lt;/a&gt; est trés bien, par contre ne prenez aucune option en plus pour le moment dans ce logiciel.&lt;br/&gt;
- Le mieux c&#039;est d&#039;enregistrer toutes les images des pages dans un format comme le .tiff&lt;br/&gt;&lt;/p&gt;


&lt;h4 id=&quot;partie2&quot;&gt;&lt;b&gt;Si vous avez déjà le livre scanné&lt;/b&gt;&lt;/h4&gt;
&lt;p&gt; Si vous avez déjà les images séparées de votre livre c&#039;est parfait, sinon tappez cette commande : &quot; pdfimages -j votre_fichier.pdf 0 &quot; cette commande va extraire toutes les images de votre pdf.&lt;br/&gt;
Maintenant munissez vous du logiciel &lt;a href=&quot;http://scantailor.sourceforge.net/&quot;&gt;scan tailor&lt;/a&gt;&lt;br/&gt;
Une fois installé chargeé toutes les images dans un nouveau projet et suivre le tutoriel qui vous expliqueras tout.&lt;br/&gt;
Une fois toutes ces étapes terminés, il faut ouvrir gscan2pdf, importer toutes les images et créer un fichier .djvu (beaucoup plus léger que .pdf) vous pouvez à ce moment là faire de l&#039;&lt;a href=&quot;http://fr.wikipedia.org/wiki/Reconnaissance_optique_de_caract%C3%A8res&quot;&gt;OCR&lt;/a&gt; si vous le souhaitez.&lt;br/&gt;
Voilà vous devez récupérer un super fichier djvu, et en plus super léger.&lt;br/&gt;&lt;br/&gt;Si vous avez des questions, postez un commentaire!&lt;br/&gt;</description>
		<pubDate>Wed, 29 Aug 2012 16:33:00 CEST</pubDate>
		<dc:creator>pul</dc:creator>
	</item>
</channel>
</rss>