Choisir le bon interclassement MySQL pour UTF-8

Publié par Maxence le ven, 13/02/2009 - 19:33

Pour rappel, un interclassement (ou collation en Anglais) est un ensemble de règles permettant la comparaison de caractères dans un jeu. Ce paramètre influe donc sur le résultat des tris. MySQL vous propose plusieurs interclassements pour l'UTF-8. La plupart sont spécifiques à certaines langues, comme utf8_esperanto_ci qui est prévu pour l'Esperanto. Si vous ne travaillez pas dans l'une de ces langues, comme c'est le cas pour le Français, il vous reste 3 autres options :

utf8_bin. Cet interclassement compare les codes des caractères. Il est donc très rapide, mais pas forcément très précis. Comme les codes des majuscules sont plus petits que ceux des minuscules (A = 65, a = 97), les enregistrements comportant du texte en majuscules se retrouveront placés avant les textes écrit en minuscules, ce qui ne correspondra pas forcément aux attentes de l'utilisateur.
utf8_general_ci. Cet interclassement fonctionne de façon très simple. Il supprime les accents et converti le texte en minuscules. Il est donc assez rapide.
utf8_unicode_ci est plus précis car il supporte les caractères multiples comme le e dans l'o. En contrepartie, il peut s'avérer un peu plus lent.

Donc à priori, pour le Français, on peut utiliser utf8_bin sur une colonne où tout le texte est soit en minuscules, soit en majuscules de façon à obtenir les meilleures performances. Si on n'est pas sur de la casse des caractères, il faut utiliser utf8_general_ci. Enfin, si vous travaillez avec plusieurs langues différentes, utf8_unicode_ci sera alors peut-être plus adapté.

Etiquettes:

MySQL

Commentaires

marko_

mar, 21/04/2009 - 14:35

Permalink

A noter que l'interclassement

A noter que l'interclassement le plus adapté au tri de mots en français est utf8_roman_ci, il respecte le classement des caractères accentués et des caractères liés "œ".

David, Dynamicnet

Répondre

benoit (non vérifié)

mar, 29/09/2020 - 13:19

Permalink

general_ci Supprime les

general_ci Supprime les accent et les majuscules ? C'est pas ce que je vois. J'ai un doute sur votre article.

Répondre

Ajouter un commentaire

form.antibot { display: none !important; } You must have JavaScript enabled to use this form.

Articles sur les mêmes sujets

Oracle rachète Sun...

Améliorer les performances avec Zend_Db_Profiler_Firebug

Choisir le type de colonne de ses tables MySQL

Marqueurs de temp MySQL (TIMESTAMP)

Un script batch pour copier la structure d'une base de données

Notre spécialité : la CAO/CFAO

Développement de logiciels de CAO/CFAO : compléments à Revit, AutoCAD, Inventor, Vault, Fusion 360, ArchiCAD, ZWCAD, DraftSight, SketchUp et autres logiciels de CAO/CFAO du marché ou conception de logiciels autonomes.

(+33) 6.46.40.75.66

maxence.delannoy@wiip.fr

Main menu

Choisir le bon interclassement MySQL pour UTF-8

Etiquettes:

Commentaires

A noter que l'interclassement

general_ci Supprime les

Ajouter un commentaire

Simple

Plain text

Articles sur les mêmes sujets

Notre spécialité : la CAO/CFAO

Membre du réseau ADN

Autodesk Expert Elite

Livre Revit 2024

Flux RSS

Formulaire de recherche

Main menu

You are here

Choisir le bon interclassement MySQL pour UTF-8

Etiquettes:

Commentaires

A noter que l'interclassement

general_ci Supprime les

Ajouter un commentaire

Simple

Plain text

Articles sur les mêmes sujets

Notre spécialité : la CAO/CFAO

Membre du réseau ADN

Autodesk Expert Elite

Livre Revit 2024

Flux RSS