I am working on writing a casebook with a law professor. This involves lots and lots of text in the form of cases and articles. This process reveals how achingly painful it is to prep text for use in TeX by adjusting quotation marks, adding \ in fron to $ and &, and replacing section symbols with \S \. Has anyone built utility for cleaning/preparing text? I wrote the following sed code that seems to get the job done:<div>
<br></div><div><div>s/‘/'/g</div><div>s/'\([a-z]\)/`\1/g</div><div>s/'\([A-Z]\)/`\1/g</div><div><br></div><div>s/“/"/g</div><div>s/”/"/g</div><div>s/"/''/g</div><div>s/''\([a-z]\)/``\1/g</div>
<div>s/''\([A-Z]\)/``\1/g</div><div><br></div><div>s/```/``\\,`/g</div><div>s/'''/'\\,''/g</div><div><br></div><div>s/§/ \\S \\ /g</div><div>s/&/\\&/g</div><div>s/\$/\\\$/g</div><div>
<br></div><div>I downloaded the texhelpers sed gui and set this to the default command. The process now requires I create a file, put it in a sed input folder, and then retrieve the text from the file created in the sed output folder. Not exactly a clean process.</div>
<div><br></div><div>Any thoughts out there on this issue? The ability to batch prepare text would make tasks like LaTeX-ing public domain books and law cases easy.</div><div><br></div><br>-- <br>the tide is coming in...<br>

</div>