Garden of KnowledgeSocial Sciences › Languages - Dialects
April 28, 2026

Familles Linguistiques — Classification des Langues du Vault

Les ~7000 langues du monde se regroupent en ~150 familles linguistiques. Une famille = un ancêtre commun reconstruit, partageant lexique de base, structures grammaticales et correspondances phonétiques régulières.

Vue d’ensemble — les 16 langues du vault§

LANGUES INDO-EUROPÉENNES
├── Germaniques
│   ├── Anglais
│   └── Allemand
├── Romanes
│   ├── Espagnol
│   └── Roumain
└── Indo-iraniennes
    └── Hindi

LANGUES TURCIQUES
├── Turc (oghouz occidental)
└── Azéri (oghouz occidental)

LANGUES SINO-TIBÉTAINES
├── Mandarin (sinitique)
└── Hakka-Khek (sinitique)

LANGUES AUSTRONÉSIENNES
├── Indonésien (malayique)
├── Malais (malayique)
└── Sambas (malayique — dialecte)

LANGUES DRAVIDIENNES
└── Tamoul

LANGUES AFRO-ASIATIQUES
├── Arabe libanais (sémitique)
└── Kabyle (berbère)

LANGUES CRÉOLES (à base anglaise)
└── Tok Pisin

Indo-européen — la plus grande famille§

Avec ~3,2 milliards de locuteurs, c’est la famille la plus parlée au monde. Origine commune : ~6000-4000 av. J.-C., proto-indo-européen probablement parlé dans les steppes pontiques.

Branche germanique§

LangueLocuteursSous-groupe
Anglais1,5 milliard L1+L2Germanique occidental
Allemand95 millions L1Germanique occidental (haut-allemand)
Néerlandais24 millionsGermanique occidental
Suédois, danois, norvégien~20 millionsGermanique septentrional

Trait commun : mutation consonantique (loi de Grimm), fort/faible verbe distinction, tendance à perdre les cas (sauf allemand).

Branche romane (italique)§

LangueLocuteursOrigine
Espagnol500M L1Latin vulgaire d’Hispanie
Français80M L1Latin vulgaire de Gaule
Italien65M L1Latin vulgaire d’Italie
Portugais250M L1Latin vulgaire ibérique
Roumain24M L1Latin vulgaire de Dacie

Trait commun : héritées du latin vulgaire (~Vᵉ siècle). Le roumain est isolé, encerclé de langues slaves — d’où ses emprunts importants au slave et au turc.

Branche indo-iranienne§

LangueLocuteursSous-groupe
Hindi / Ourdou600M+Indo-aryen
Bengali230MIndo-aryen
Persan (farsi)80MIranien
Pachto50MIranien
Kurde35MIranien

Hindi et Ourdou sont mutuellement intelligibles à l’oral mais s’écrivent dans deux alphabets différents (Devanagari vs Arabe-Perse).

Turcique — l’arc anatolien-asiatique§

Famille de ~200M de locuteurs, étendue de la Turquie à la Sibérie.

LangueLocuteursPays
Turc80MTurquie, Chypre
Azéri32MAzerbaïdjan, Iran
Ouzbek35MOuzbékistan
Kazakh13MKazakhstan
Turkmène7MTurkménistan
Tatare5MRussie
Ouïghour11MChine (Xinjiang)

Trait commun : agglutination, harmonie vocalique, ordre SOV, postpositions, pas de genre. Turc et azéri sont mutuellement intelligibles à 80 % (branche oghouze occidentale).

Sino-tibétaine — Mandarin et ses cousins§

Deuxième plus grande famille mondiale (~1,4 milliard).

LangueLocuteursSous-groupe
Mandarin920MSinitique
Cantonais85MSinitique
Hakka45MSinitique
Wu (shanghaïen)80MSinitique
Min (Hokkien, Taiwanais)70MSinitique
Tibétain6MTibéto-birman
Birman33MTibéto-birman

Trait commun : langues isolantes, tonales, classificateurs, ordre SVO, écritures logographiques (chinois) ou alphasyllabiques (tibétain, birman).

Les “dialectes” chinois (mandarin, cantonais, hakka…) sont en réalité des langues distinctes mutuellement non intelligibles, mais partagent l’écriture des caractères chinois.

Austronésienne — la famille océanique§

Famille très étendue : Madagascar à l’île de Pâques. ~390M de locuteurs.

LangueLocuteursPays
Indonésien270M (L1+L2)Indonésie
Malais290M (avec indonésien)Malaisie, Brunei, Singapour
Sambas600 000Indonésie (Kalimantan)
Tagalog (Philippin)90MPhilippines
Javanais80MIndonésie
Malgache25MMadagascar
Maori50 000Nouvelle-Zélande
Hawaïen24 000Hawaii

Trait commun : affixation riche, redoublement, ordre VSO/SVO selon la sous-branche. Indonésien et malais sont quasi-identiques (différence comparable au portugais brésilien vs européen).

Dravidienne — l’Inde du Sud§

Famille de ~250M de locuteurs, principalement en Inde du Sud et au Sri Lanka. Probablement antérieure à l’arrivée des Indo-européens en Inde.

LangueLocuteursRégion
Tamoul78MTamil Nadu, Sri Lanka, Singapour
Telugu82MAndhra Pradesh, Telangana
Kannada44MKarnataka
Malayalam35MKerala
Tulu2MCôte sud-ouest

Trait commun : agglutination, ordre SOV, suffixes verbaux complexes, pas de genre grammatical (sauf tamoul partiellement), retroflexes phonologiques.

Afro-asiatique — sémitique et berbère§

Sous-familleLangue (vault)Autres
SémitiqueArabe libanaisHébreu, amharique, araméen
BerbèreKabyleTachelhit, Tamazight, Touareg
CouchitiqueSomali, oromo
TchadiqueHaoussa
Égyptien (mort)Copte

Trait commun : racines triconsonnantiques (en sémitique surtout), genre grammatical, conjugaison riche, écriture droite-à-gauche (arabe, hébreu).

Créoles — naissance moderne§

Les créoles ne sont pas une famille au sens strict — chacun a une base lexicale distincte.

CréoleBase lexicaleSubstratLocuteurs
Tok PisinAnglaisMélanésien, allemand4M (PNG)
BislamaAnglaisMélanésien100K (Vanuatu)
PijinAnglaisMélanésien25K (Salomon)
Créole haïtienFrançaisAfricain de l’Ouest12M
KrioAnglaisAfricain de l’Ouest6M (Sierra Leone)
PapiamentoPortugais/EspagnolAfricain270K (ABC islands)

Trait commun : grammaire simplifiée, pas de conjugaison ni cas ni genre, vocabulaire majoritairement européen, avec emprunts au substrat.

Langues isolées et autres familles non représentées§

Le vault couvre ~5 % des langues mondiales. Familles importantes absentes :

FamilleLocuteursReprésentants
Niger-Congo700MSwahili, yoruba, zoulou, igbo
Japonique130MJaponais, ryukyu
Coréenne80MCoréen (parfois isolée)
Ouralienne25MFinnois, hongrois, estonien
Caucasienne du Nord8MTchétchène, géorgien (kartvélienne)
Aïnou (en danger)<10Aïnou
Basque750KEuskara — isolat

Carte des familles dans le vault§

FamilleLangues du vaultContinent dominant
Indo-européen5 (Anglais, Allemand, Espagnol, Roumain, Hindi)Europe + Inde
Turcique2 (Turc, Azéri)Asie centrale
Sino-tibétain2 (Mandarin, Hakka)Chine
Austronésien3 (Indonésien, Malais, Sambas)Indonésie
Dravidien1 (Tamoul)Inde du Sud
Afro-asiatique2 (Arabe-Libanais, Kabyle)Afrique du Nord, Levant
Créole1 (Tok Pisin)Océanie

Mythes et précisions§

”Le finnois et le hongrois sont liés au turc”§

Faux. Le finnois et le hongrois sont ouraliens. Le turc est turcique. Ressemblances dues à des contacts historiques et à la typologie agglutinante partagée, pas à un ancêtre commun.

”L’arabe et l’hébreu sont du même groupe”§

Vrai. Tous deux sémitiques — ils partagent ~30 % de racines. Shalom / Salam (paix) est cognat.

”Le japonais et le chinois sont liés”§

Faux. Le japonais est dans une famille japonique distincte. Il a emprunté massivement au chinois (sinogrammes, lexique) mais ne partage pas la grammaire ni la phonologie.

”Le hindi et l’arabe sont apparentés”§

Faux. Hindi est indo-européen, arabe est afro-asiatique. L’urdu (variante de l’hindi) a beaucoup d’emprunts arabes mais reste indo-européen structurellement.

Pourquoi cette classification compte§

ApportDétail
ApprentissageApprendre une langue d’une famille connue est plus facile (cognats, structure familière)
CognatsLes liens lexicaux héritages aident à mémoriser
Cohérence cognitiveComprendre qu’une langue n’est pas isolée mais une variante d’une famille élargit la perspective
HistoriqueLes familles racontent les migrations humaines
—The Gardener