Web of Science

Web of Science er en delbase i Web of Knowledge, hvis du ikke kan hente alle datafelter hjem, har du ikke valgt den enkelte database, men søger i hele WoK-database-samlingen. Citationstal i WoS alene er derfor også lidt lavere end man ser i den "samlede" base.

Til nøjere analyser af mange referencer, er det nødvendigt at downloade dem i et format, der let kan håndteres af regneark eller databaser. Referencerne downloades - 500 ad gangen - med Save to Other File Format + Record Content > Full Record + File Format: Tab-delimited (Win eller Mac + UTF-8). Undgå det "rene" Tab-delimited format der benytter tegnsæt UTF-16.

Downloadfilerne får fortløbende navne "savedrecs.txt", "savedrecs1.txt" .. - brug evt. dette Skema til brug ved download af poster, 500 ad gangen

Gå altid tilbage til svarsættet gennem WoS's egen "Return"-knap, hvis du bruger browserens "Back"-knap mister du på et tidspunkt forbindelsen til svarsættet, som kun kan genskabes ved en ny identisk søgning. Rækkefølgen af poster er den samme ved en ny identisk søgning samme dag.

Indlæs datasættet i en database, og lav en "pæn" bibliografisk post af datafelterne UT | SO | VL | IS | BP | EP | AR > brug BIB.pl til at samle datafelterne i en samlet streng: UT <tab> BIB-post, denne flettes sammen med rådata-sættet vha. UT-fælles nøglen.

Kort-format udtræk fra WoS

Hvis man kun skal bruge dokumentets titel, UT-nummer og tidsskriftets navn, kan det isoleres fra oversigtens (10-50 posters) kildekode med følgende regex:

<value lang_id="">(.*?)</value>.*?isickref=(.*?)&amp;.*?$
<value>(.*?)</value>

- erstat med:
>>>TI: \1 -- UT: \2 -- SO: \3

De søgte ord er highlighted i oversigten, de kan fjernes med
<span class="hitHilite">(.*?)</span>

-erstat med:
\1

Citationsanalyser

De fleste analyser laves bedst på rådata, WoS's egen Create Citation Report-link i hvert svarsæt rummer ofte mange falske hits. Hvis man istedet gensøger WoS-poster (se nedenfor) fungerer værktøjet, men man har brug for at rense det for de mange 0'ler i oversigten

Forfatteranalyser (publikationstal)

I WoS er alle en artikels forfattere og alle adresser fra artiklens "hoved" samlet i felt C1. Hvis der er flere forfattere, er alle navne fra samme institution samlet på formen:

[Forfatter1; Forfatter2] Institution_A; [Forfatter3] Institution_B; [Forfatter4; Forfatter5; Forfatter6] Institution_C


Hvis en forfatter er tilknyttet flere institutioner (i forhold til den enkelte publikation) optræder navnet flere steder.
For at kunne adskille hvert navn med tilhørende institutionsadresse, skal listen splittes efter to typer semikolon, først efter institutioner, derefter skal hvert forfatternavn i den skarpe parentes tilordnes den afsluttende institutionsadresse.

Fulde navne indekseres fra og med 2008 (2006 ??). Der er ikke i alle tilfælde adresse-oplysninger på alle navne (gælder især konferencebidrag), så et forfatterskab kan ikke alene søges gennem arbejdsstedets adresse.
Indekseringspraksis hos WoS gennem årene

Gensøg kendte Web of Science poster

Når man allerede har fundet referencer i Web of Science, er det let at gensøge dem vha. af WoS's UT-numre. Hvis du gemmer dine referencer i et regneark, kan du blot markere og kopiere UT-kolonnens indhold og sætte den ind i et simpelt tekstdokument: i WORD: Gem som .txt

Man søger op til 50 UT-numre ad gangen i WoS Advanced Search - med dette program kan du generere søgeprofiler med op til 500 numre, hver profil er adskilt fra næste sæt med 500 numre med en stiplet linie, så det er let at klippe/klistre søgeprofilen ind i WoS-søgeboksen.

Klik Search - WoS genererer et svarsæt #1 … osv. og tømmer automatisk søgefeltet, når det er klar til næste portion UT-numre. NB. Den sidste post i søgeprofilen med de sidste poster er … OR UT=(000000000000000) - hvis søgestrengen indeholder færre end 50 UT-numre - ikke en fejl.

Alle svarsæt OR'es sammen, WoS tillader her kun 50 stakkede operatorer, så den genererede fil med UT-søgeprofilerne indeholder også et par linier af typen:

#1 OR #2 OR #3 OR … #50
og
#51 OR #52 .. OR #100

så du let kan samle de enkelte svarsæt.

Link til WoS-post gennem UT

http://ws.isiknowledge.com/cps/openurl/service?url_ver=Z39.88-2004&rft_id=info:ut/A1985AQQ2100007 - eller:
http://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcAuth=RID&SrcApp=RID&DestLinkType=FullRecord&DestApp=ALL_WOS&KeyUT=000378448400112

Links til artikler der citerer en given artikel (gennem dennes UT):
http://gateway.webofknowledge.com/gateway/Gateway.cgi?GWVersion=2&SrcApp=GSSearch&SrcAuth=Scholar&DestApp=WOS_CPL&DestLinkType=CitingArticles&UT=000378448400112

Adresseanalyser

C1: fulde forfatternavne (hvis tilgængelige) + adresser for hver enkelt forfatter. Tappes som UT | C1

Datasættet splittes ud på hver forfatter + hver adresse vedkommende optræder med:

1. Kør først gennem programmet Mask semicolons in [], det sikrer, at semikoloner inde i [ ] ikke bidrager til opsplitning af forfatter - adresse-strengen

2. Erstat TAB med %TAB

3. Erstat semikolon med linieskift#.
NB I sjældne tilfælde kan forfatter-parentesen gælde for flere adressestrenge adskilt af semikolon, de nu løsrevne adressestrenge kan genfindes med regex'en: \n#([^\[]) - erstattes med: ; double_affiliation \1

4. Kør derefter gennem programmet Add header to line, datasættet ser nu således ud:

UT TAB [Forfatter ## Forfatter .. ## Forfatter] Adressestreng - eller (og mest for ældre poster)
UT TAB Adressestreng

For at sikre, at UT, (evt.) forfatternavn og adresse senere optræder som tre adskilte kolonner, kan man gøre følgende:
a. Erstat TAB med TABTAB
b. Erstat TABTAB[ med TAB[ - så ser datasættet således ud:

UT TAB [Forfatter ## Forfatter .. ## Forfatter] Adressestreng
UT TAB TAB Adressestreng

5. Erstat ] med TAB og slet alle [ - resultatet er:

UT TAB Forfatter ## Forfatter .. ## Forfatter TAB Adressestreng

6. Ombyt rækkefølgen af de tre søjler og saml UT + adresse til eet felt med følgende regex:

(.*?)\t(.*?)\t(.*?)$ - erstat med: \1 | \3%\t\2

UT | Adressestreng \t%Forfatter ## Forfatter .. ## Forfatter

7. Erstat #[ ] linieskift# og kør igen datasættet gennem programmet Add header to line, alle navne er nu adskilt og står samme med publiceringsadressen

8. Til slut: Ombyt rækkefølgen af datafelter med (.*?) \| (.*?)\t(.*?)$ erstat med \1\t\3\t\2. I poster med kun adresse og intet forfatternavn skal man også til slut erstatte | med TABTAB

Hvis C1-feltet ikke indeholder navne og adresser på forfattere, skal RP (reprint) feltet inddrages.

Adresser i ældre WoS-poster mangler mellemrum efter komma, kan indsættes med regex: ,([A-Z]) + match case; erstat med , \1

WoS datafelter

WoS Datafields | Wos Research Areas | Wos Research Areas SU=

Recorded training

http://wokinfo.com/training_support/training/web-of-science/#recordedtraining

Rettelser til WoS-indhold

http://ip-science.thomsonreuters.com/techsupport/datachange/

Direkte links til WoS

http://wokinfo.com/media/pdf/OpenURL-guide.pdf = THOMSON REUTERS (SCIENTIFIC) OpenURL RESOLVER

Kuriosa

Post med flest forfattere ??
Search for squarks and gluinos using final states with jets and missing transverse momentum with the ATLAS detector in root s=7 TeV proton-proton collisions
By: Aad, G.; Abdallah, J.; Abdelalim, A. A.; et al. = flere end 3000
Group Author(s): ATLAS Collaboration
PHYSICS LETTERS B Volume: 701 Issue: 2 Pages: 186-203 Published: JUL 4 2011
UT=WOS:000292993900005

Medmindre andet er angivet, er indholdet af denne side licenseret under Creative Commons Attribution-ShareAlike 3.0 License