<br><br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="gmail_quote"><div>Sigh.  Work on automatic indexing, classification, and content analysis of digitized text goes back at least to the mid-1960s and I think much earlier.  A five-minute search through my files showed up papers by  Edmunson, Lesk, Marcus, Matthews, Reintjes, Salton, Stone, Zimmerman, and others.  I'm not an expert in the field so assume that there are _many_ others.   <span class="HOEnZb"><font color="#888888"><br>

</font></span></div></div></blockquote></div><div><br></div><div>Yup. A good friend was in on the ground floor of the XML project because  her <span style="background-color:rgb(255,255,255);font-size:13px;white-space:pre-wrap"> The Womens' Writers Project</span> + <span style="background-color:rgb(255,255,255);font-size:13px;white-space:pre-wrap">Literary</span></div>

<div><span style="background-color:rgb(255,255,255);font-size:13px;white-space:pre-wrap">Tagging Working Group </span>(Brown) was transcribing and tagging female authors' works in SGML on the Mainframe (accessible only by BITNET originally). That project was started in 1988, so not total prehistory.</div>

<div><a href="http://listserv.brown.edu/?A2=ind89&L=CHUG-L&D=0&P=3602">http://listserv.brown.edu/?A2=ind89&L=CHUG-L&D=0&P=3602</a> .</div><div>Much re-invention of the wheel here, and to insert a MAPhorism, re-invention of the Travois as well, no doubt. </div>

<div><br></div>-- <br>Bill<br>@n1vux <a href="mailto:bill.n1vux@gmail.com" target="_blank">bill.n1vux@gmail.com</a><br>