字符集#

该模块将指定的字符集添加到“Content-Type”响应头字段。此外,该模块可以在某些限制条件下将数据从一种字符集转换为另一种字符集:

  • 转换是单向的——从服务器到客户端,

  • 仅支持单字节字符集的转换

  • 或单字节字符集与 UTF-8 之间的转换。

配置示例#

include        conf/koi-win;

charset        windows-1251;
source_charset koi8-r;

指令#

charset#

语法

charset charset | off;

默认值

charset off;

上下文

http, server, location, if in location

将指定的字符集添加到“Content-Type”响应头字段。如果该字符集与 source_charset 指令中指定的字符集不同,则会进行转换。

参数 off 取消将字符集添加到“Content-Type”响应头字段。

字符集可以用变量定义:

charset $charset;

在这种情况下,变量的所有可能值需要至少在配置中以 charset_mapcharsetsource_charset 指令的形式出现一次。对于 utf-8windows-1251koi8-r 字符集,只需将文件 conf/koi-winconf/koi-utfconf/win-utf 包含到配置中即可。对于其他字符集,只需制作一个虚构的转换表,例如:

charset_map iso-8859-5 _ { }

此外,可以在“X-Accel-Charset”响应头字段中设置字符集。可以使用 proxy_ignore_headersfastcgi_ignore_headersuwsgi_ignore_headersscgi_ignore_headersgrpc_ignore_headers 指令禁用此功能。

charset_map#

语法

charset_map charset1 charset2 { ... }

默认值

上下文

http

描述从一种字符集到另一种字符集的转换表。使用相同的数据构建反向转换表。字符代码以十六进制表示。范围 80-FF 中缺失的字符被替换为“?”。从 UTF-8 转换时,单字节字符集中缺失的字符被替换为“&#XXXX;”。

示例:

charset_map koi8-r windows-1251 {
    C0 FE ; # small yu
    C1 E0 ; # small a
    C2 E1 ; # small b
    C3 F6 ; # small ts
}

在描述到 UTF-8 的转换表时,UTF-8 字符集的代码应在第二列中给出,例如:

charset_map koi8-r utf-8 {
    C0 D18E ; # small yu
    C1 D0B0 ; # small a
    C2 D0B1 ; # small b
    C3 D186 ; # small ts
}

koi8-rwindows-1251,以及从 koi8-rwindows-1251utf-8 的完整转换表在发行文件 conf/koi-winconf/koi-utfconf/win-utf 中提供。

charset_types#

语法

charset_types mime-type ...;

默认值

charset_types text/html text/xml text/plain text/vnd.wap.wml application/javascript application/rss+xml;

上下文

http, server, location

在响应中启用模块处理,指定的 MIME 类型除了“text/html”之外。特殊值“*”匹配任何 MIME 类型。

override_charset#

语法

override_charset on | off;

默认值

override_charset off;

上下文

http, server, location, if in location

确定是否应对从代理或 FastCGI/uwsgi/SCGI/gRPC 服务器接收到的响应进行转换,当响应中已经带有“Content-Type”响应头字段中的字符集时。如果启用转换,则使用接收到的响应中指定的字符集作为源字符集。

备注

如果响应是在子请求中接收到的,则无论 override_charset 指令设置如何,总是会执行从响应字符集到主请求字符集的转换。

source_charset#

语法

source_charset encoding;

默认值

上下文

http, server, location, if in location

定义响应的源字符集。如果该字符集与 charset 指令中指定的字符集不同,则会进行转换。