SpringBoot项目处理emoji表情到mysql

2022年7月17日10:17:56

Mysql设置字符集编码,程序设置连接客户端编码来解决emoji表情

emoji表情现在是日常生活中必不可少的存在了,首先我们先了解一下为什么emoji表情不能像普通的字符处理?emoji 其实是表情符号,来自日语词汇“絵文字”(假名为“えもじ”,读音即 emoji)。

最早由栗田穰崇(Shigetaka Kurita)创作,并在日本网络及手机用户中流行。 自苹果公司发布的 iOS 5 输入法中加入了emoji 后,这种表情符号开始席卷全球。
目前 emoji 已被大多数现代计算机系统所兼容的 Unicode 编码采纳,普遍应用于各种手机短信和社交网络中。

主要是因为MySQL 默认使用的是UTF8 编码,UTF8 编码只支持 1-3 个字节。
而 emoji 占有 4 个字节的存储空间,所以自然保存不了。但是从 MYSQL5.5 开始,可支持 4 个字节 UTF 编码,只要将编码标记成 utf8mb4 即可。并且utf8mb4 是兼容 UTF8 的。

接下来就是处理这个问题的一些方法:从数据库和程序出发解决问题!

1.设置数据库,表,字段编码为utf8mb4

根据自己的需求选择设置字符集编码,可以手动设置(直接选中某个字段设置编码方式。数据库只能创建的时候设置,但是不推荐手动创建方式),也可以通过sql语句设置,但是用这两种方式都有可能造成锁表!前提是数据量特别大,所以请慎重!

  • 设置某个字段字符集编码

    altertable`tableName` change 字段名 字段名varchar(20)characterset 字符集编码;
  • 设置数据库表的字符集编码

    # 默认的字符排序规则ALTERTABLE offline_hana_ztbasicCONVERTTOCHARACTERSET utf8mb4;# 可以设置字符排序规则ALTERTABLE offline_hana_ztbasic9CONVERTTOCHARACTERSET utf8mb4COLLATE utf8mb4_unicode_ci;
  • 修改某个数据库的字符集编码

    alterdatabase`databaseName`defaultcharacterset 字符集编码;
  • 修改数据库默认的字符集编码

    打开 MySQL 配置文件(Windows 下是 my.ini,Linux 下是 my.cnf)修改配置,将编码改成 utf8mb4

    [client]
    default-character-set=utf8mb4[mysql]
    default-character-set=utf8mb4[mysqld]
    init-connect=’SET NAMES utf8mb4′
    character-set-server=utf8mb4

    修改之后必须重启mysql服务。

2.设置客户端连接数据库编码

可能有些人跟我一样,设置完数据库里面的字符编码集后,程序还是报错,问题还是没解决。可能每个人的编码软件不一样或者设置不一样。反正经过上面的设置,已经可以在数据库手动插入emoji表情,并且可以保存。

那么问题来了,怎么解决呢?

根据数据源的不同,设置的也不同。

# 以下是最常用的数据源  
# druid的方式
spring.datasource.druid.connection-init-sqls=set names utf8mb4;
# hikari
spring.datasource.hikari.connection-init-sql=set names utf8mb4;

设置完成之后,就大功告成啦!

  • 作者:MellowYou
  • 原文链接:https://blog.csdn.net/Jeck_wu/article/details/119178280
    更新时间:2022年7月17日10:17:56 ,共 1406 字。