<div dir="ltr"><div>Hi David,</div><div><br></div><div>At UC/JEPS we use CollectionSpace (CSpace) as our specimen database. In CSpace, there are separate tables for collectors (i.e. recordedBy) and determiners (i.e. identifiedBy), as well as nomenclatural authorities and type assertion authorities. All of these &quot;organizations&quot; tables are related to a separate &quot;persons&quot; table, which is like the &quot;agents&quot; table you describe.</div><div><br></div><div>Have a table is great, but keeping it up is another thing. We have done pretty well with keeping our &quot;organizations&quot; linked up to &quot;persons&quot; from our earliest digitization project to digitize California plant specimens, but as we&#39;ve gone further afield it becomes more difficult. You point out the various complications in maiden and married names, etc., and staff and digitization students (not to mention OCR in Symbiota) cannot reliably resolve the ambiguities and record the links in the persons table.</div><div><br></div><div>To answer your question, we do not record ORCIDs in our persons table, but it would make an excellent addition to CSpace and can be done. Collection-wide it is difficult to keep a perfectly related &quot;persons&quot; table, but perhaps directed efforts at contemporary &quot;persons of interest&quot; to determine their output would be feasible and constructive.</div><div><br></div><div>And regarding collector name order, at least in plants the first name is the &quot;main collector&quot;, i.e. the person to whom the recordNumber corresponds, and all subsequent names fall into the same category of &quot;other collectors&quot;, where the order isn&#39;t necessarily related to level of contribution</div><div><br></div><div>As a side note regarding aggregation at the Consortium of California Herbaria, back way before the days of ORCIDs, my predecessor kept a canonical list of California collectors and in the process of aggregation he munged all collectors into consistent strings. The scope of CCH has grown so much since then that this is no longer kept up either, but perhaps with the advent of ORCIDs the existing dormant information could be put to use again?</div><div><br></div><div>David</div><div><br></div><br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_quote">---------- Forwarded message ----------<br>From: <b class="gmail_sendername">Shorthouse, David</b> <span dir="ltr">&lt;<a href="mailto:davidpshorthouse@gmail.com" target="_blank">davidpshorthouse@gmail.com</a>&gt;</span><br>Date: Thu, Feb 18, 2016 at 6:46 AM<br>Subject: [Nhcoll-l] collector &amp; determiner identities<br>To: <a href="mailto:nhcoll-l@mailman.yale.edu" target="_blank">nhcoll-l@mailman.yale.edu</a><br><br><br>All,<br>
<br>
For the past several months, I have been experimenting with the<br>
reconciliation of collector and determiner names in digitized specimen<br>
data, using the Canadensys network of aggregated records as a small<br>
case study.<br>
<br>
As you may well know, the Darwin Core terms recordedBy, identifiedBy,<br>
and indeed scientificNameAuthorship contain people names. To my<br>
knowledge, no one has tried to reveal the human effort and the<br>
implicit social networks using content in these terms, perhaps because<br>
the expected content and format of these terms is so under-specified.<br>
Maiden and married names, nicknames, variously abbreviated given<br>
names, etc. are but a few examples that make ad-hoc reconciliation<br>
heuristics &amp; algorithms very difficult to do well. You can explorer my<br>
first, albeit naive experiments at <a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__collector.shorthouse.net&d=AwIBaQ&c=-dg2m7zWuuDZ0MUcV7Sdqw&r=CLFZJ3fvGSmDp7xK1dNZfh6uGV_h-8NVlo3fXNoRNzI&m=l4-dQ15l7SFEeJeMGIcnWDPyDO7p7IhxNa2gtk34qho&s=mZIjOrs0Vcy44oRHHM8RA14ALH6lG441BSzX1tdtxkI&e=" rel="noreferrer" target="_blank">https://urldefense.proofpoint.com/v2/url?u=http-3A__collector.shorthouse.net&amp;d=AwIBaQ&amp;c=-dg2m7zWuuDZ0MUcV7Sdqw&amp;r=CLFZJ3fvGSmDp7xK1dNZfh6uGV_h-8NVlo3fXNoRNzI&amp;m=l4-dQ15l7SFEeJeMGIcnWDPyDO7p7IhxNa2gtk34qho&amp;s=mZIjOrs0Vcy44oRHHM8RA14ALH6lG441BSzX1tdtxkI&amp;e=</a> .<br>
There&#39;s potential here, but the next logical step is to lift this up<br>
to something like a Darwin Core extension such that data managers at<br>
the source have a mechanism to unambiguously link &amp; share each of the<br>
one-to-many, specimen-to-name pairs to human identity.<br>
<br>
I am writing to inquire if anyone knows of any best practices guides<br>
on how museum staff *ought* to record the names of collectors,<br>
determiners, and other agents. Do any of you have an *agents* table in<br>
your database? Have you attempted to link people names in your<br>
specimen databases to their unambiguous identities and, by extension<br>
to their scientific outputs like datasets &amp; papers published? Does<br>
anyone yet record ORCIDs, <a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__orcid.org_&d=AwIBaQ&c=-dg2m7zWuuDZ0MUcV7Sdqw&r=CLFZJ3fvGSmDp7xK1dNZfh6uGV_h-8NVlo3fXNoRNzI&m=l4-dQ15l7SFEeJeMGIcnWDPyDO7p7IhxNa2gtk34qho&s=xTk1sgn3JolA6nk4mkV9oxQRdpMuKhWdddwtdnuA8tU&e=" rel="noreferrer" target="_blank">https://urldefense.proofpoint.com/v2/url?u=http-3A__orcid.org_&amp;d=AwIBaQ&amp;c=-dg2m7zWuuDZ0MUcV7Sdqw&amp;r=CLFZJ3fvGSmDp7xK1dNZfh6uGV_h-8NVlo3fXNoRNzI&amp;m=l4-dQ15l7SFEeJeMGIcnWDPyDO7p7IhxNa2gtk34qho&amp;s=xTk1sgn3JolA6nk4mkV9oxQRdpMuKhWdddwtdnuA8tU&amp;e=</a>  for this purpose? Last,<br>
does the ordering of determiner or collector names on labels contain<br>
any semantic meaning as it does for papers? That&#39;s something I have<br>
not yet considered &amp; quite frankly scares me if this is important.<br>
<br>
Hope this generates some discussion,<br>
<br>
David P. Shorthouse<br>
_______________________________________________<br>
Nhcoll-l mailing list<br>
<a href="mailto:Nhcoll-l@mailman.yale.edu" target="_blank">Nhcoll-l@mailman.yale.edu</a><br>
<a href="http://mailman.yale.edu/mailman/listinfo/nhcoll-l" rel="noreferrer" target="_blank">http://mailman.yale.edu/mailman/listinfo/nhcoll-l</a><br>
<br>
_______________________________________________<br>
NHCOLL-L is brought to you by the Society for the Preservation of<br>
Natural History Collections (SPNHC), an international society whose<br>
mission is to improve the preservation, conservation and management of<br>
natural history collections to ensure their continuing value to<br>
society. See <a href="https://urldefense.proofpoint.com/v2/url?u=http-3A__www.spnhc.org&d=AwMFaQ&c=-dg2m7zWuuDZ0MUcV7Sdqw&r=CLFZJ3fvGSmDp7xK1dNZfh6uGV_h-8NVlo3fXNoRNzI&m=OxbB0P5YghTa4XkPVXrxjnTfpb0U87J5P4H5aKi9sEM&s=oEGcjrbyVPhFbkL50cLOcXkki0FKKaUneQIdsC4aOGQ&e=" rel="noreferrer" target="_blank">http://www.spnhc.org</a> for membership information.<br>
Advertising on NH-COLL-L is inappropriate.<br>
</div><br></div>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div><div dir="ltr">David Baxter<div>Biodiversity Informatics Manager<br>University and Jepson Herbaria<br>1001 Valley Life Sciences Building<br>University of California, Berkeley<br>Berkeley, CA 94720<br><a href="tel:%28510%29%20642-2465" value="+15106422465" target="_blank">(510) 642-2465</a></div></div></div>
</div></div>