相关推荐recommended
[MySQL]数据库原理2,Server,DataBase,Connection,latin1、UTF-8,gb2312,Encoding,Default Collation——喵喵期末不挂科
作者:mmseoamin日期:2023-12-18

[MySQL]数据库原理2,Server,DataBase,Connection,latin1、UTF-8,gb2312,Encoding,Default Collation——喵喵期末不挂科,第1张

希望你开心,希望你健康,希望你幸福,希望你点赞!

最后的最后,关注喵,关注喵,关注喵,佬佬会看到更多有趣的博客哦!!!

喵喵喵,你对我真的很重要!

目录

前言

认识字符集和校对原则

MySQL 5.5支持的字符集和校对原则

常用字符集和校对原则

确定字符集和校对原则

描述字符集的系统变量

MySQL用下列的系统变量描述字符集。

字符集的依存关系

修改默认字符集

修改默认字符集

使用MySQL字符集时的建议

预习建立数据库和表

配套练习

总结


前言

MySQL 能够支持 39 种字符集和 127 个校对原则。 细化为 4 个层次: 服务器 (Server) 、数据库 ( DataBase ) 、数据表 (Table) 和连接层 (Connection) 。  MySQL 服务器 默认的字符集是 latin1 ,如果不进行设置,那么连接层级、客户端级和结果返回级、数据库级、表级、字段级都默认使用 latin1 字符集。 在向表录入中文数据、查询包括中文字符的数据时,会出现类似“ ? ”这样的 乱码 现象。 在创建存储过程或存储函数时,也经常由于字符集的不统一出现错误。 本任务从认识字符集和校对原则着手,学习 MySQL 支持的字符集和校对原则。 着重介绍 latin1 、 UTF-8 和 gb2312 字符集。 通过认识描述字符集的系统变量,学习掌握修改默认字符集的方法。 介绍在实际应用中,如何选择合适的字符集。

认识字符集和校对原则

字符 (Character) 是指人类语言中最小的表义符号。例如 ‘A’ 、 ‘B’ 等。 给定一系列字符,并给每个字符指定一个数值来进行表示,这个数值就是 对应字符的编码( Encoding ) 。 给定一系列字符,并给每个字符进行编码后,所有字符和编码对组成的集合就是字符集( Character  set )。比如: ASSII 码。 字符校对原则 (Collation) 是指在 同一字符集内字符之间的 比较规则。 [MySQL]数据库原理2,Server,DataBase,Connection,latin1、UTF-8,gb2312,Encoding,Default Collation——喵喵期末不挂科,第2张 确定字符序后,才能在一个字符集上定义什么是等价的字符( a 是否等价 A ),以及字符之间的大小关系。 每个字符序唯一对应一种字符集,但 一个字符集可以对应多种字符校对原则 ,其中有一个是默认字符校对原则 (Default Collation) 。 MySQL 中的字符序名称遵从命名惯例:以字符序对应的字符集名称开头;以 _ci( 表示大小写不敏感 ) 、 _cs( 表示大小写敏感 ) 或 _bin( 表示按编码值比较 ) 结尾。例如,在字符序“ utf8_general_ci “下,字符 'a' 和 'A' 是等价的。

MySQL 5.5支持的字符集和校对原则

MySQL 5.5 服务器能够支持 39 种字符集和 127 个校对原则。 任何一个给定的字符集至少有一个校对原则,也可能有几个校对原则。 可以使用 SHOW 命令列出可用的字符集及对应校对原则。如:

   mysql >SHOW CHARACTER SET;

     mysql> SHOW COLLATION LIKE ‘latin1%’;


常用字符集和校对原则

Latin1

  系统启动时默认的字符集,是一个8位字符集,字符集名称为ISO 8859-1Latin 1,也简称为ISO Latin-1。

  它把位于128~255之间的字符用于拉丁字母表中特殊语言字符的编码,也因此而得名。

UTF-8 ( 8-bit Unicode Transformation Format )

  被称为通用转换格式,是针对Unicode字符的一种变长字符编码,又称万国码。

  对英文使用8位(即1个字节),中文使用24位(3个字节)来编码。

  UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。

   UTF-8编码的文字可以在各国支持UTF-8字符集的浏览器上显示。

gb 2312

  是简体中文字符集,GBK是对GB 2312的扩展,其校对原则是分别为gb2312_chinese_ci、gbk_chinese_ci。

   GBK的文字编码不论中、英文字符均使用双字节表示。GBK通用性比UTF-8差,占用的数据库较小。

  GBK、GB 2312与UTF-8之间都必须通过Unicode编码才能相互转换。

   对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。


确定字符集和校对原则

描述字符集的系统变量

MySQL 对于字符集的支持细化到 4 个层次 : 服务器 (Server) 、数据库 ( DataBase ) 、数据表 (Table) 和连接 (Connection) 。 MySQL 对于字符集的指定 可以细化 到一个数据库、一张表和一列。

MySQL用下列的系统变量描述字符集。

character_set_ server 和 collation_ server :这两个变量是 服务器 的字符集,默认的 内部 操作字符集。 character_set_ client :客户端来源数据使用的字符集,这个变量用来决定 MySQL 怎么 解释 客户端发到服务器的 SQL 命令文字。

character_set_connection和collation_connection :连接层字符集。这两个变量用来决定MySQL怎么处理客户端发来的SQL命令。

character_set_results:查询结果字符集,当SQL有结果返回的时候,这个变量用来决定发给客户端的结果中文字量的编码。

character_set_database和collation_database :当前选中数据库的默认字符集,create database命令有两个参数可以用来设置数据库的字符集和比较规则。character_set_system:系统元数据的字符集,数据库、表和列的定义都是用的这个字符集。它有一个定值,是UTF-8 。

以“collation_”开头的同上面对应的变量,用来描述字符集校对原则。

有的字符集概念并没有一个系统变量表示,如:

表所使用的字符集,在创建表的语句中指定,作为该表中列字体集的默认值。

 列所使用的字符集,决定本列的文字数据的存储编码。列的比较规则比collation_connection高。也就是说,MySQL会把SQL中的文字直接量转成列的字符集后再与列的文字数据比较。


字符集的依存关系

[MySQL]数据库原理2,Server,DataBase,Connection,latin1、UTF-8,gb2312,Encoding,Default Collation——喵喵期末不挂科,第3张

MySQL 默认的服务器级的字符集,决定客户端、连接级和结果级的字符集。 服务器级的字符集决定数据库的字符集。 数据库的字符集决定表的字符集。 表的字符集决定字段的字符集。

MySQL默认字符集

编译 MySQL 时,指定了一个默认的字符集,这个字符集是“ latin1 ”。 安装 MySQL 时,可以在 配置文件 ( my.ini )中重新指定默认字符集。 启动 MySQL 时,也可在命令行参数中重新指定默认字符集。 默认字符集最终被 应用于 character_set_server ,再被应用于其下级字符集。

修改默认字符集

修改 MySQL 的 my.ini ( C:\Program Files \MySQL\MySQL Server 5.5 )文件中的字符集

  查找[mysql]键值,在下面加上一行: default-character-set=utf8

  修改保存后,可用语句查看。

   mysql> SHOW VARIABLES LIKE ‘character%

修改默认字符集

使用 MySQL 的命令修改字符集。
 mysql> SET character_set_client = utf8 ;
  mysql> SET character_set_connection = utf8;
  mysql> SET character_set_database = utf8 ;
  mysql> SET character_set_results = utf8 ;
  mysql> SET character_set_server = utf8 ;

使用MySQL字符集时的建议

建立数据库、表和进行数据库操作时,尽量 显式指出 使用的字符集,而不是依赖于默认设置。 数据库和连接字符集都使用 latin1 时,大部分情况下都可以解决乱码问题,但无法以字符为单位来进行 SQL 操作,因此 使用 UTF-8 更好 。 注意服务器级、结果级、客户端级、连接级、数据库级、表级的字符集的统一,当数据库级的字符集设置为 UTF-8 时,表级与字段级的字符集也是 UTF-8 。

预习建立数据库和表

建立数据库和表是指在计算机系统中创建一个存储数据的地方,并在其中创建表格来组织和管理数据。数据库是一个可以被多个用户同时访问和操作的数据存储系统,而表则是数据库中的一个结构化数据容器。下面将介绍如何建立数据库和表。

首先,选择一个适合的数据库管理系统(DBMS),如MySQL、Oracle或SQL Server等。这些DBMS提供了丰富的功能和工具来管理和操作数据库。

接下来,通过运行DBMS提供的命令或工具来创建数据库。一般情况下,可以使用CREATE DATABASE语句来创建数据库,并指定数据库的名称。例如,CREATE DATABASE mydatabase;创建一个名为mydatabase的数据库。

创建数据库之后,就可以在其中创建表格了。表格用于存储数据,并且有一定的结构和规则。使用CREATE TABLE语句可以创建一个新的表格。在CREATE TABLE语句中,需要指定表格的名称和列的信息。每个列都有一个名称和数据类型。例如,CREATE TABLE customers (id INT, name VARCHAR(50), email VARCHAR(100));将创建一个名为customers的表格,并包含id、name和email三列,分别是整数和两个字符串。

在创建表格之后,可以使用INSERT语句来向表格中插入数据。INSERT语句可以插入一条或多条数据。例如,INSERT INTO customers (id, name, email) VALUES (1, 'John', 'john@example.com');将向customers表格中插入一条数据。

创建数据库和表格后,就可以使用SELECT语句来查询数据,使用UPDATE语句来更新数据,使用DELETE语句来删除数据等。这些语句可以通过DBMS提供的命令行界面或图形化界面来执行。

总之,建立数据库和表是管理和组织数据的重要步骤。通过选择合适的DBMS,并使用相应的命令和工具,可以轻松地创建数据库和表格,并对其中的数据进行管理和操作。


配套练习

一、mysql注释:

mysql注释符有三种:1、#...2、--  ...3、/*...*/

二、启动mysql服务器(startup)à打开命令窗口clientà输入:

2.1  mysql >SHOW CHARACTER SET;//显示所有字符集

 mysql> SHOW COLLATION LIKE ‘latin1%’;//显示以latin1开头的校对(Collation)规则:

2.2.  修改MySQL的配置文件my.ini(自己安装的mysql路径)文件中的字符集     

查找[mysql]键值,在下面加上一行: default-character-set=utf8

修改保存后,可用语句查看。

mysql> SHOW VARIABLES LIKE 'character%';

重新启动服务器后再次查看字符集(先shutdown再startup)

2.3使用MySQL的命令修改字符集,修改后可用show variables like ‘character%’;查看。

         mysql> SET character_set_client = utf8 ;

         mysql> SET character_set_connection = utf8;

         mysql> SET character_set_database = utf8 ;

         mysql> SET character_set_results = utf8 ;

         mysql> SET character_set_server = utf8 ;

三、解决发送前的乱码

MySQL> SET NAMES ‘UTF8 ’;

与这3个语句等价:

                  mysql> SET character_set_client =UTF8;

                mysql> SET character_set_results = UTF8;

                  mysql> SET character_set_connection =UTF8;

四、修改MySQL的my.ini文件中,将默认字符集修改为gb2312。

提前预热

以下是MySQL的简单代码示例:

先看看,喵~

连接到MySQL数据库

import mysql.connector
mydb = mysql.connector.connect(
  host="localhost",
  user="yourusername",
  password="yourpassword"
)
print(mydb)

创建数据库

import mysql.connector
mydb = mysql.connector.connect(
  host="localhost",
  user="yourusername",
  password="yourpassword"
)
mycursor = mydb.cursor()
mycursor.execute("CREATE DATABASE mydatabase")

创建表

import mysql.connector
mydb = mysql.connector.connect(
  host="localhost",
  user="yourusername",
  password="yourpassword",
  database="mydatabase"
)
mycursor = mydb.cursor()
mycursor.execute("CREATE TABLE customers (name VARCHAR(255), address VARCHAR(255))")

插入数据

import mysql.connector
mydb = mysql.connector.connect(
  host="localhost",
  user="yourusername",
  password="yourpassword",
  database="mydatabase"
)
mycursor = mydb.cursor()
sql = "INSERT INTO customers (name, address) VALUES (%s, %s)"
val = ("John", "Highway 21")
mycursor.execute(sql, val)
mydb.commit()
print(mycursor.rowcount, "record inserted.")

总结

MySQL 能够支持 39 种字符集和 127 个校对原则。 细化为 4 个层次: 服务器 (Server) 、数据库 ( DataBase ) 、数据表 (Table) 和连接层 (Connection) 。  MySQL 服务器 默认的字符集是 latin1 ,如果不进行设置,那么连接层级、客户端级和结果返回级、数据库级、表级、字段级都默认使用 latin1 字符集。 在向表录入中文数据、查询包括中文字符的数据时,会出现类似“ ? ”这样的 乱码 现象。 在创建存储过程或存储函数时,也经常由于字符集的不统一出现错误。 本任务从认识字符集和校对原则着手,学习 MySQL 支持的字符集和校对原则。 着重介绍 latin1 、 UTF-8 和 gb2312 字符集。 通过认识描述字符集的系统变量,学习掌握修改默认字符集的方法。 介绍在实际应用中,如何选择合适的字符集。

希望你开心,希望你健康,希望你幸福,希望你点赞!

最后的最后,关注喵,关注喵,关注喵,佬佬会看到更多有趣的博客哦!!!

喵喵喵,你对我真的很重要!

[MySQL]数据库原理2,Server,DataBase,Connection,latin1、UTF-8,gb2312,Encoding,Default Collation——喵喵期末不挂科,第4张