[ALLI-2324] Tekijärajaukset ja tekijäkenttien välisten relevanssipainotusten tasapainottaminen MARC:issa Created: 25.11.2013 11:53  Updated: 12.05.2016 10:51  Resolved: 14.01.2016 16:45

Status: Resolved
Project: Finna
Component/s: None
Fix Version/s: v1.32.0

Type: Improvement Priority: Major
Reporter: Teemu Talja (Inactive) Assignee: Teemu Talja (Inactive)
Resolution: Duplicate Votes: 0
Labels: None

Issue Links:
Blocker
blocks ALLI-2332 Yleisimmät tekijät järjestämisperuste... Resolved
Continuing Issue
is continued in ALLI-2326 Tekijä-nimekehaun backend-parannukset In Design
is continued from ALLI-2258 Tekijään ja teokseen kohdistuvat haut... Resolved
Parallel Report
is parellel report to ALLI-2360 Aakkosellisen haun käyttöliittymän p... On Hold
is parellel report to ALLI-3045 Toteutus ja evaluointi: title_full_un... Resolved
is parellel report to ALLI-3998 pf/ps tekijäkentille + näiden yleiset... To Do
is parallel report to ALLI-2259 Tekijään ja teokseen kohdistuvat haut... Resolved
Related issue
is related to ALLI-3998 pf/ps tekijäkentille + näiden yleiset... To Do
Story Points: 3
Actual Story Points: 8
Epic Link: Relevanssi

 Description   

Ongelma ilmenee nyt haettaessa yleisellä, konvention mukaisella hakusanan muodolla [sukunimi, etunimi], koska 245:ssä pilkkua voi olla käytetty eri tarkoituksessa kuin sukunimen ja etunimen erottaminen.

Säädetään relevanssia niin, että osumat kentissä 100 (/110?) ja 700 nousevat hakutuloslistoissa tekijä- ja tekijäteos-hauissa ylemmäs kuin vastaavat osumat 245c:ssä. Tärkeimmistä kentistä vielä 100:lle (ja 110:lle?) voitaisiin antaa eniten painoarvoa.

Kentät 100 ja 700 ovat yleensä muodossa [sukunimi, etunimi], kun taas 245:ssa on vapaamuotoisempaa selitystä, jossa muoto voi olla esim. [rooli: etunimi sukunimi].


Poiminta Hannu Markkasen viestistä (FINNAPOSTI-180)

"Näyttää siltä, että hakutuloslistaa ("virtanen matti") järjestettäessä painotetaan 245 - kentän sisältöä ja esim. 100 - ja 700 - kenttiä huomioidaan vasta myöhemmin. Tuloslistan ensimmäisissä tietueissa [...] kun noi loppu (8 ekaa), listalla rupesi esiintymään oikeat Matti Virtasen kirjat ts. sellaiset, joissa 245 - kentässä nimi oli muodossa matti virtanen ja tuo ”virtanen matti” esiintyi joko kentässä 100 tai 700."
"Haku muodolla ”matti virtanen” tuottaa 59 osumaa ja tuloslistassa ensimmäisenä ovat tietueet, joissa ”matti virtanen” esiintyy 245c –kentässä yksin, jolloin hänen nimensä esiintyy author -kentässä. Hakutuloksissa author listautuu ennen author2:sta."
"Jännä yksityiskohta on se, että kun hakutuloksen järjestää Tekijän mukaan, alkuun nousee kymmenkunta teosta, jossa virtanen on author2 - kentässä ja author –kentässä on ihan muita tekijöitä."

https://jyu.finna.fi/Search/Results?lookfor=%22virtanen+matti%22&prefilter=-&SearchForm_submit=Hae&retainFilters=0

Ks. myös poiminnat Leena Janssonin ja Erkki Nurmen viesteistä (FINNAPOSTI-405 ja FINNAPOSTI-301) (kommenteissa).



 Comments   
Comment by Teemu Talja (Inactive) [ 25.11.2013 13:34 ]

Poiminta Leena Janssonin viestistä

"Ilman lainausmerkkejä kentistä 245, 505, 700 ja 979 tulee irrelevantteja tuloksia."

Comment by Teemu Talja (Inactive) [ 25.11.2013 13:34 ]

Poiminta Erkki Nurmen viestin liitteestä

"Miten tällainen [tekijä-nimeke-] indeksi tehdään [...] ymmärtääkseni siihen otetaan alkuun päävastuullinen tekijä (marc: 100 tai 110). ja sen perään nimeke (240 tai sen puuttuessa 243 tai senkin puuttuessa 245). Mikäli marc-tietueessa on ns. analyyttinen lisäkirjaus, eli kenttä 700 2-indikaattorin arvolla 2, siinä on jo valmiiksi tekijä-nimeke-yhdistelmä joka otetaan sellaisenaan.

Comment by Teemu Talja (Inactive) [ 26.11.2013 11:41 ]

"Meidän" Erkiltä tuli huomio, että jotkut hakutulokset (esim. Marjatta Virtaset) nousevat senkin takia ehkä kovin ylös, että 245c on poimittu full title -kenttään. Onko tämä 245c:n paikka jäänne ajalta, jolloin (Kansalliskirjaston toiveesta) 245c oli otsikon perässä, eikä sille ollut omaa paikkaa tekijä-kentän alla? Jos tälle ei ole selvää käyttötarkoitusta, 245c:n voisi kyllä poistaa otsikkokentistä. Jos otsikossa joku Marc21-tekijäkenttä olisi, miksi ei ennemmin 100 tai 700?

Comment by Teemu Talja (Inactive) [ 03.12.2013 14:13 ]

Eren mukaan 245c ei liity Tutki-käyttöliittymätoiveeseen, vaan kaikki 245-kentät tulevat full titlee. Ere arveli, että ei ole mahdoton ajatus, että otettaisiin 245 pois full titlestä, koska se löytyisi all fieldsistä kuitenkin, ja että tämä vaatisi kuitenkin huolellista tutkimustyötä, mikä vaikutus tällä muutoksella olisi yleiseen relevanssinlaskentaan Finnassa.

Comment by Teemu Talja (Inactive) [ 14.01.2016 16:45 ]

Rajataan MARC-aineistoissa tekijän osalta tekijä- ja tekijä-otsikkohakuihin mukaan osumat kentissä 100, (/110?) 700 (ja 245c?). Tekijä- ja tekijäteos-haut eivät kohdistu MARC-kenttiin 505 ja 979. Osumat näissä kentissä rajautuvat ulos tekijä- ja tekijäteos-hakujen hakutuloksista.

Generated at Sun May 31 09:22:21 EEST 2020 using Jira 7.13.12#713012-sha1:6e07c38070d5191bbf7353952ed38f111754533a.