On Wed, Dec 19, 2012 at 5:14 PM, Joly MacFie <span dir="ltr"><<a href="mailto:joly@punkcast.com" target="_blank">joly@punkcast.com</a>></span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr"><div><br></div><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote">but not before many here were born :)<br></blockquote></div></blockquote>
<div><br>Sigh.  Work on automatic indexing, classification, and content analysis of digitized text goes back at least to the mid-1960s and I think much earlier.  A five-minute search through my files showed up papers by  Edmunson, Lesk, Marcus, Matthews, Reintjes, Salton, Stone, Zimmerman, and others.  I'm not an expert in the field so assume that there are _many_ others.   <br>
<br>But perhaps that was before Ms. Johnston was born and therefore doesn't count :-(<br> <br>      john<br><br><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr"><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote"><div class="gmail_quote">---------- Forwarded message ----------<br>From: <b class="gmail_sendername">Library of Congress</b> <span dir="ltr"><<a href="mailto:loc@service.govdelivery.com" target="_blank">loc@service.govdelivery.com</a>></span><br>


<br><div><table align="center" border="0" cellpadding="0" cellspacing="0" width="700"><tbody><tr><td><a name="13bb54acef3d24b4_13bb4ab05fc225bd_ri6410901"></a>
<div style="margin-bottom:2em">
<div style="font-weight:bold;font-size:120%;margin:0 0 0.3em;padding:0"><a href="http://blogs.loc.gov/digitalpreservation/2012/12/before-you-were-born-we-were-digitizing-texts/" target="_blank">Before You Were Born: We Were Digitizing Texts</a></div>



<div style="font-size:90%;margin:0 0 0.3em;padding:0;color:#666666;font-style:italic">12/19/2012 01:48 PM EST</div>
<br>
<div style="margin:0 0 0.3em;padding:0">We are all pretty familiar with the process of scanning texts to produce page images and converting them using optical character recognition to full-text indexing and searching. But electronic texts have a far older-pedigree. Text digitization in the cultural heritage sector started in earnest in 1971, when the first Project Gutenberg text — the United [...]</div>
<span class="HOEnZb"><font color="#888888">

</font></span></div></td></tr></tbody></table></div></div></blockquote><span class="HOEnZb"><font color="#888888"><br clear="all"><div><br></div>-- <br>---------------------------------------------------------------<br>Joly MacFie  <a href="tel:218%20565%209365" value="+12185659365" target="_blank">218 565 9365</a> Skype:punkcast<br>
WWWhatsup NYC - <a href="http://wwwhatsup.com" target="_blank">http://wwwhatsup.com</a><br>

 <a href="http://pinstand.com" target="_blank">http://pinstand.com</a> - <a href="http://punkcast.com" target="_blank">http://punkcast.com</a><br> VP (Admin) - ISOC-NY - <a href="http://isoc-ny.org" target="_blank">http://isoc-ny.org</a><br>


--------------------------------------------------------------<br>-
</font></span></div>
</blockquote></div><br>