Alfabetisch rangschikken of alfabetiseren houdt in dat gegevens op volgorde van de letters van het alfabet worden geplaatst. Woorden die met dezelfde letter beginnen, komen bij elkaar te staan, ongeacht de betekenis, en worden onderling verder gesorteerd op hun overige letters. In de talen met een alfabetisch schrift bestaan hier verschillende conventies voor.

Het voordeel van een alfabetische ordening is dat deze, gegeven de conventie, eenduidig is, zodat bijna iedereen met kennis van het alfabet en de conventie makkelijk kan vinden wat hij of zij zoekt, zonder nadere kennis over de inhoud. Daarmee is deze volgorde ook neutraal. De alfabetische volgorde wordt dan ook veel gebruikt, bijvoorbeeld in lijsten, registers, in naslagwerken zoals woordenboeken, telefoongidsen en encyclopedieën en voor plaatsing van de boeken in een bibliotheek. Ook bij elektronische informatie worden zoekresultaten vaak alfabetisch geordend. Nadeel van de alfabetische rangschikking is dat er geen inhoudelijke samenhang is; in sommige gevallen zal men liever voor een chronologische, numerieke of systematische ordening kiezen.

Geschiedenis

De volgorde van de 26 letters is standaard (in kapitalen): A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z. Deze volgorde houdt misschien verband met het feit dat de letters vroeger ook wel als cijfers werden gebruikt. Over het ontstaan van de alfabetische volgorde is weinig bekend. Er is een duidelijke overeenkomst aan te wijzen met de volgorde van andere alfabetten, zoals het Grieks, Hebreeuws en Fenicisch.

Sommige letters die tegenwoordig als volwaardige letters gelden, zijn recent toegevoegd door modificatie van bestaande letters. Ze komen in de volgorde vlak vóór of na de oorspronkelijke letter. Deze letters zijn J, U en W. Ook de Y is een recente toevoeging. De K is al eerder uit het Grieks overgenomen. In teksten van enkele eeuwen geleden treft men deze letters dan ook niet aan.

Basisprincipes

In het Latijnse alfabet, zoals dat ook voor de Nederlandse taal wordt gebruikt, zijn er 26 letters die een vaste volgorde kennen. In sommige talen beschouwt men bepaalde lettercombinaties (digrafen) en letters met diakritische tekens als zelfstandige ‘letter’ met een eigen positie in het alfabet (zie de heikele punten verderop).[bron?] Dit doet niet af aan de basisprincipes voor het alfabetisch sorteren van losse woorden:

Als de lijst met te sorteren gegevens niet alleen uit losse woorden bestaat, maar ook uit titels, namen of termen van meerdere woorden, wordt het ingewikkelder, want dan moet een keuze worden gemaakt tussen twee vormen van alfabetische rangschikking:

Heikele punten

Te alfabetiseren teksten staan tegenwoordig vaak al op een computer, die ze ook kan sorteren. De tekens van de tekenset hebben dan door nummering en/of interne representatie al een volgorde waarop gesorteerd kan worden. Een teken met een lager nummer, zoals de A, komt voor een letter met een hoger nummer, zoals de Z. In veel tekensets zoals ASCII heeft de spatie een lager nummer dan alle letters. In dat geval komt de rangschikking van woordgroepen overeen met de woord-voor-woordmethode: woordgrenzen zijn daarin immers belangrijker dan de letters van het volgende woord.

Eenvoudige computersortering werkt prima als de gegevens ook weer door een computer opgezocht moeten worden, maar voor gebruik door mensen stelt men vaak andere eisen:

Achternamen

Alfabetische volgorde bij namen volgens Taaladvies.net (van de Taalunie) in 2006:

"Voor een gewone lijst met namen (bijvoorbeeld klanten of personeelsleden) adviseren wij om de familienaam in zijn geheel vooraan te laten staan en de spaties te negeren. Wij raden af om rekening te houden met spaties (en eventuele apostrofs) in de familienaam, want dit zou tot gevolg hebben dat een naam als Van den daele vóór Vande Kerckhove komt te staan.

Andere talen

In andere talen met van het Latijn afgeleid alfabet bestaan vaak andere conventies voor de alfabetische volgorde.[bron?]

Als voorbeeld wordt hier het Hongaars genomen.[bron?] Hongaars wordt geschreven met een vrijwel fonetisch alfabet van 44 grafemen ("letters").

Om de in het Latijnse alfabet ontbrekende medeklinkers van het Hongaars weer te geven zijn digrafen en trigrafen in gebruik, zoals de digrafen "cs", "dz", "sz", en de trigraaf "dzs". Lange medeklinkers worden dubbel geschreven. De di- en trigrafen krijgen elk een eigen afdeling in het woordenboek, tussen de andere letters. Verdubbelde di- en trigrafen in woorden worden bij het sorteren gerekend als twee "letters". Daarnaast worden lange klinkers onderscheiden van de korte met boven de letter geplaatste diakritische tekens (puntjes of streepjes). Bij het alfabetiseren van woorden in een woordenboek worden korte en lange klinkers bij elkaar gesorteerd.

De alfabetische volgorde (inclusief de letters uit leenwoorden) is:

  • A, Á, a, á
  • B, b
  • C, c
  • Cs, cs (bij verdubbeling: ccs)
  • D, d
  • Dz, dz (bij verdubbeling: ddz)
  • Dzs, dzs (bij verdubbeling: dzzs)
  • E, É, e, é
  • F, f
  • G, g
  • Gy, gy (bij verdubbeling: ggy)
  • H, h
  • I, Í, i, í
  • J, j
  • K, k
  • L, l
  • Ly, ly (bij verdubbeling: lly)
  • M, m
  • N, n
  • Ny, ny (bij verdubbeling: nny)
  • O, Ó, o, ó
  • Ö, Ő, ö, ő
  • P, p
  • Q, q
  • R, r
  • S, s
  • Sz, sz (bij verdubbeling: ssz)
  • T, t
  • Ty, ty (bij verdubbeling: tty)
  • U, Ú, u, ú
  • Ü, Ű, ü, ű
  • V, v
  • W, w
  • X, x
  • Y, y
  • Z, z
  • Zs, zs (bij verdubbeling: zzs)

Zie ook