Regex: Forfatternavne med initialer - Alment

Adskille forfatternavn fra adressestreng

Format: PostID TAB Efternavn, Intialer med punktum, Adressestreng


3 initialer:

(.*?)\t([\w\ \-]*+), ([\w-])\.([\w-])\.([\w-])\., (.*?)$

erstat med:

\1\t\2, \3.\4.\5.\t\6


2 inititaler

(.*?)\t([\w\ \-]*+), ([\w-])\.([\w-])\., (.*?)$

erstat med:

\1\t\2, \3.\4.\t\5


1 initialer

(.*?)\t([\w\ \-]*+), ([\w-])\., (.*?)$

erstat med:

\1\t\2, \3.\t\4


Hvis initialer indeholder bindestreger:

(.*?)\t([\w\ \-]*+), ([-\w])\.(-?)([-\w])\., (.*?)$

erstat med: \1\t\2, \3.\4\5.\t\6


Navne-Adressestrenge hvor samme adresse skal tilføjes flere forfatternavne

Forudsætter samme postID for streng med adresse og strenge fra samme reference og dermed med samme postID:

Format:

PostID TAB Efternavn(e), Initialer (med punktum) TAB Adressestreng
PostID TAB Efternavn(e), Initialer (med punktum)

(.*?)\t(.*?)\t(.*?)$
\1\t([^\t]*?)

erstat med:

\1\t\2\t\3
\1\t\4\t\3

NB: Virker ikke, hvis fornavne er skrevet fuldt ud.


Muligt fix: poster med ø-navne: Olsen, Sø. - hjælper måske også på bindestregsproblematikken

\t([^,]*?), ([\w-])\.([\w-ø]*?)\.,


Samme navn optræder dobbelt

F.eks. fra medarbejderliste med fotos gemt som kildekode

(.*?) (.*?) \1 \2 \t » \1 \2\t

Vær opmærksom på at de to "ens" navne kan være forskellige pga. forskelligt antal mellemrum i navnet

Medmindre andet er angivet, er indholdet af denne side licenseret under Creative Commons Attribution-ShareAlike 3.0 License