用聚类分析的方法分类观察者颜色匹配函数
黄敏, 郭春丽, 何瑞丽, 习永惠
北京印刷学院印刷与包装工程学院, 北京 102600

作者简介: 黄 敏, 女, 1979年生, 北京印刷学院印刷与包装工程学院教授 e-mail: huangmin@bigc.edu.cn

摘要

色觉正常的观察者, 尤其是不同年龄段的观察者, 颜色分辨能力具有较大的差异。 为了分类色觉正常观察者的锥细胞光谱响应, 补充现有CIE1931, CIE1964和CIE2006颜色匹配函数, 基于Stiles&Burch数据集的47个观察者函数(10°视场)和CIE2006代入20~80岁(10°视场)观察者不同年龄产生的61个函数(共108个颜色匹配函数), 用聚类分析方法中的k-medoids算法, 计算距离选用欧氏距离的平方, 将108个颜色匹配函数在$\bar{x}$( λ), $\bar{y}$( λ), $\bar{z}$(λ)三个通道分别聚为5类, 共产生了5×5×5=125个类别。 将108个颜色匹配函数作为108个“个体观察者”, 在iPad显示设备上呈现CIE推荐的17个颜色, 用108个颜色匹配函数和125个类别颜色匹配函数比较, 计算17个颜色的CIEDE2000色差平均值, 以最小色差值作为评价标准, 从125个类别中挑选出10个分类观察者颜色匹配函数表征观察者锥细胞光谱响应。 108名“观察者”中有77.8%的观察者属于这10个分类。 在iPad显示设备上显示CIE推荐的5个颜色(灰、 红、 黄、 绿、 蓝色), 组织30名(20~25岁)年轻观察者和17名(61~74岁)老年观察者, 在Quato专业显示器上依次匹配5个目标色, 共采集到158组, 即790个(=158组×5个色中心)颜色匹配实验数据。 为将这158组数据(视为158名“观察者”)进行分类, 分别将10个分类颜色匹配函数代入计算, 以计算得到5个颜色CIEDE2000色差平均值最小的颜色匹配函数, 作为158名观察者相对应的分类, 在10个分类观察者函数中优选出8个颜色匹配函数BIGC-1, BIGC-2, …, BIGC-8。 进一步地, 用优化建立的分类颜色匹配函数检验课题组前期基于近同色异谱色样对开展的目视色差比较实验, 结果发现BIGC-3适用于年轻观察者, BIGC-5适用于老年观察者, 同时计算得到的STRESS值也较其他颜色匹配函数的结果有所降低。

关键词: 聚类分析; 分类观察者函数; 颜色匹配函数; 生理老化; 观察者同色异谱
中图分类号:TN41 文献标志码:A
Classification of Color Matching Functions with the Method of Cluster Analysis
HUANG Min, GUO Chun-li, HE Rui-li, XI Yong-hui
School of Printing and Packaging Engineering, Beijing Institute of Graphic Communication, Beijing 102600, China
Abstract

Larger color discrimination difference exits among observers with normal color vision, especially those of different ages. In order to classify the cone fundamentals among normal color observers, the 108 color matching functions (CMFs) including 47 Stiles&Burch CMFs and 61 CMFs computed by CIE2006 model were respectively classified into 5 categories in $\bar{x}$( λ), $\bar{y}$( λ), $\bar{z}$( λ) three channels by using the k-medoids algorithm of clustering analysis method as well as the square of Euclidean distance and a total of 5×5×5=125 categories were generated. Taking the 108 CMFs as 108 “individual observers”, the 17 color centers recommended by CIE were displayed on the center of iPad and 108 CMFs were compared with 125 categorical functions, then the average of 17 colors’ CIEDE2000 color differences were calculated. Finally 10 categorical CMFs were selected from those 125 categories to represent the spectral response of human cone cells. The results indicated that 77.8% from the 108 “real observers” were satisfied, which regarded the obtained minimum color difference as the objective function. As the target colors, CIE recommended 5 colors (gray, red, yellow, green, blue) were presented on the iPad and 30 young observers aged 20 to 25 and 17 old observers aged 61 to 74 were organized to match 5 color centers correspondingly on Quato display. Therefore, 158 groups, 790 color data (each group includes 5 color centers) were obtained and then categorized by computing CIEDE2000 color difference using 10 categorical CMFs. The CMFs possessing the minimum color difference value were assigned as the corresponding classification of 158 observers and finally 8 out of 10 categories were selected and named BIGC-1, BIGC-2, …, BIGC-8, which were used to test the results of paired comparison experiment based on metameric color samples in our previous study. The obtained results show that BIGC-3 CMFs worked well for young observers while BIGC-5 CMFs were suitable to old observers. Additionally, the calculated results of STRESS value were also lower than the results computed by other CMFs.

Keyword: Cluster analysis; Categorize observer functions; Color matching functions; Physiological aging; Observer metamerism
引言

颜色是一种视觉感知, 色觉正常观察者的感红、 感绿和感蓝锥细胞接收到不同强度的光信号会产生相应的神经冲动传给大脑, 从而引起颜色感觉。 现有量化表示观察者锥细胞光谱响应, 计算颜色色度值的颜色匹配函数(color matching functions, CMFs)仅有CIE国际照明委员会推荐的CIE1931和CIE1964标准观察者函数[1], 代表了不同观察视场下(2° 和10° )人眼的平均锥细胞光谱响应。 CIETC1-36分会于2006年推出了CIE2006[2]颜色匹配函数计算模型, 该模型考虑到年龄和视场角的因素, 可产生20~80岁不同年龄观察者和1° ~10° 不同视场角的颜色匹配函数, 但在实际使用中需要代入观察者的真实年龄, 较不方便。 而且研究表明[3, 4, 5], 相同年龄的观察者其锥细胞光谱响应并不完全相同, 在模型中使用观察者的真实年龄, 与使用该年龄段观察者平均年龄得到的颜色匹配函数计算结果之间具有较大的偏差, 很难将CIE2006模型应用于实际的颜色计算和评价过程。

不同观察者之间的颜色匹配度, 受样本对的颜色刺激光谱形状影响较大。 当样本对间的光谱差异较大, 特别是某一样本对由窄带原色光谱组成时, 观察者之间的颜色分辨差异会被放大[6]。 随着窄带、 宽色域显示设备的出现, 观察者同色异谱现象尤为严重。 为了更为精确地进行颜色复制, 许多显示设备生产商开始设计多个单色性较好的原色光谱, 比如激光显示器, 这虽然明显地增大了显示设备的色域, 但是同时却放大了观察者间的辨色差异及同色异谱现象。

为了更好地表征不同类别观察者的颜色分辨差异, 方便进行颜色表征及不同设备间颜色的色差评价, 本文基于108个颜色匹配函数, 用聚类分析的方法进行观察者颜色匹配函数的分类。 选用iPad上显示的17个颜色进行分类的计算优选, 用iPad和Quato专业显示器的颜色匹配实验数据进行分类的实验优选, 用反射色的色差比较实验数据进行分类的检验。 分类的BIGC-颜色匹配函数可补充现有CIE1931, CIE1964和CIE2006的颜色匹配函数, 更好地描述不同年龄段个体观察者的锥细胞光谱响应。

1 颜色匹配实验

研究中[7]曾选取了5台具有不同原色光谱的显示设备开展了观察者同色异谱差异的比较, 模拟计算和颜色匹配实验结果均表明显示设备的原色光谱能放大观察者间的颜色分辨差异。 如表4所示, 以iPad为目标设备, Quato显示设备较其他三台显示设备(NEC241, NEC242, EIZO-CG19)与目标设备iPad的差异最大, 颜色匹配实验得到的 OM¯值为9.59, 最小值为EIZO-CG19与iPad间的结果, OM¯值为3.89。

表4 不同颜色匹配函数的峰值波长位置 Table 4 Positions of peak wavelengths of different color matching functions

为更好地表现不同观察者的锥细胞光谱响应差异, 在前期组织30名年轻观察者采用5台显示设备开展颜色匹配实验的基础上, 本实验又增加了17名老年观察者, 在Quato显示设备与iPad显示设备间, 基于CIE推荐的5个颜色开展了颜色匹配实验, 实验装置示意图如图1所示。 实验的参数与过程均与前期5台显示设备间的颜色匹配实验操作相同[7]。 两台显示设备三原色的光谱能量分布如图2所示, 其中虚线为目标设备iPad的R(λ ), G(λ ), B(λ )三原色光谱能量分布, 实线为Quato显示器的R(λ ), G(λ ), B(λ )三原色光谱能量分布。 由图2可见, 两台显示设备的原色光谱能量曲线的形状、 带宽和峰值波长位置都有较大的差异, 在颜色匹配实验过程中可产生同色异谱样本对。

所有年轻观察者均为北京印刷学院印刷工程专业的学生, 色觉正常并具有颜色科学的基础理论知识; 所有老年观察者色觉正常, 无明显眼类疾病。 30名年轻观察者(14男16女), 年龄分布在20到27岁, 5名观察者重复了8组实验, 2名观察者重复了2组实验, 23名观察者进行了1组实验, 共采集到67组(=5× 8+2× 2+23× 1), 335个(=67组× 5个色中心)颜色匹配数据。 17名老年观察者(5男12女), 年龄分布在61到74岁, 6名观察者重复了8组实验, 10名观察者重复了4组实验, 1名观察者重复了3组实验, 共采集到91组(=6× 8+10× 4+1× 3), 455个(=91组× 5个色中心)颜色匹配数据。 整个颜色匹配实验过程共收集到158组, 790个颜色匹配数据。

图1 颜色匹配实验装置Fig.1 The setup of color matching experiment

图2 显示设备和目标设备三原色的光谱分布Fig.2 Spectral Power Distributions of the target and matched displays in three channels

2 聚类分析的方法分类颜色匹配函数
2.1 Sarkar的分类方法

CIE TC 1-36分会提出的CIE2006计算模型忽略了相同年龄观察者间的个体差异。 2011年, Sarkar[8]提出将1959年的Stiles& Burch的47个观察者颜色匹配函数[9]和CIE2006模型计算20~80岁不同年龄观察者的61个颜色匹配函数结合产生108个配色函数(如图3所示)。 在聚类分析方法中[10], 采用K-Means的聚类分析工具, 计算聚类的距离指标D(distance)为欧氏距离的平方, 进行20次迭代在 x̅(λ ), y̅(λ )和 z̅(λ )三个通道分别聚为5类, 产生了5× 5× 5=125个分类颜色匹配函数。 基于D65光源照明下的240个Colorchecker反射样品, 分别计算125个分类函数与47个Stiles& Burch颜色匹配函数(代表真实观察者的锥细胞响应)间的最小CIEDE2000色差平均值, 从而挑选出可表征每一个Stiles& Burch观察者锥细胞光谱响应的函数。 图4为Sarkar聚类的8个颜色匹配函数, 其中, Sarkar指出S7和S8颜色匹配函数更适合于表征老年观察者的锥细胞光谱响应。

图3 108个颜色匹配函数的光谱响应Fig.3 The spectral response of 108 CMFs

图4 Sarkar提出的8个类别观察者函数分布Fig.4 The distributions of Sarkar Proposed 8 categories

2.2 改进后的分类方法

Sarkar在聚类分析时, 选用的评价样本为D65光源照明下的240个Colorchecker色卡, 其光谱曲线变化较为平缓, 本文中, 基于CIE推荐的17个颜色中心[11], 在iPad三原色显示设备上显示17个颜色作为参考色, 其光谱辐射能量分布如图5(a)所示。 参考色用CIE1964颜色匹配函数计算得到的色度值如表1所示, 其中标注“ * ” 的为上述颜色匹配实验中使用的5个颜色中心。

图5 用于聚类分析颜色样品的颜色刺激光谱能量分布
(a): iPad显示器显示的17个颜色; (b): D65照明体下Colorchecker色卡中的24色
Fig.5 The spectral curves of the color stimuli used for cluster analysis
(a): 17 iPad displayed colors; (b): 24 Colorchecker illuminanted by D65 illuminant

表1 计算用17个颜色的色度值 Table 1 The colorimetric values of 17 color centers

在Sarkar的聚类分析中, 使用的k-means算法对于异常值十分敏感, 因此选用k-medoids算法, 以集群中位于最中心的对象, 而不是将集群中的平均值作为参考点。 分类的方法仍然基于最小化每个对象与其参考点之间的不相似程度之和的原理进行[10]。 在聚类分析时, 选用50次迭代, 计算聚类的距离指标D(distance)仍为欧氏距离的平方。 将108个颜色匹配函数在 x̅(λ ), y̅(λ )和 z̅(λ )三个通道分别聚为5类。 为比较选用Colorchecker反射色卡和iPad自发光色作为目标色的区别, 选用24个Colorchecker色卡在D65标准照明体下的颜色刺激能量光谱分布曲线[如图5(b)所示], 进行聚类分析结果的比较。

进行聚类分析时, 发现选用图5(b)中Colorchecker色卡的光谱数据作为测试色(即类似于Sarkar的方法), 108个颜色匹配函数分类较为集中, 无法有效的完成分类。 选用图5(a)所示的17个自发光色的光谱数据作为参考色, 将108个颜色匹配函数的 x̅(λ ), y̅(λ )和 z̅(λ )三个通道分别聚为5类。 图6所示, 黑色曲线表示108个颜色匹配函数的光谱响应, 红色、 绿色和蓝色曲线分别表示 x̅(λ ), y̅(λ )和 z̅(λ )三个通道的5个聚类的光谱响应, 共产生了5× 5× 5=125个类别颜色匹配函数。

图6 聚类产生的颜色匹配函数Fig.6 Reduced set of x- y- z- color matching functions plotted on 108 observer data

为了在这125个类别中挑选出适合表征观察者锥细胞光谱响应的函数, 将108个颜色匹配函数作为108个“ 个体观察者” 的锥细胞光谱响应, 分别和125个类别比较, 代入图5(a)所示iPad上显示的17个颜色刺激光谱, 计算XYZ色度值, 进而计算CIEDE2000色差平均值。 以最小CIEDE2000色差值作为评价标准, 按观察者分类个数(/比例)由高到低进行排序, 挑选出前10个分类颜色匹配函数(图7所示)。 分类结果如表2所示, 有77.8%的观察者属于前10个分类。 同时可见, 在分类的颜色匹配函数中, y̅(λ )通道2-类别的颜色匹配函数并无聚类。

图7 迭代产生的前10类颜色匹配函数Fig.7 The reduced set of ten observer categories

表2 迭代产生的分类颜色匹配函数 Table 2 The detailed information of the reduced ten observer categories
3 分类颜色匹配函数的检验
3.1 颜色匹配数据的实验优选

表2中分类产生的颜色匹配函数, 代入本次基于iPad和Quato显示设备开展颜色匹配实验采集到的158组数据中(以158名“ 观察者” 进行检验)。 以计算得到最小CIEDE2000色差平均值的颜色匹配函数, 代表158名观察者相对应的分类, 结果如图8所示, 其中No.11为CIE1964颜色匹配函数。 由图8可见, 158个“ 观察者” 的颜色匹配函数分类, 无观察者属于No.2和No.7以及No.11类别。 从图8中挑选出前8个分类颜色匹配函数, 即有观察者分类归类的颜色匹配函数。 将观察者分类个数由高到低进行排序, 重新命名为BIGC-1, BIGC-2, …, BIGC-8, 分别对应图8中的No.10, No.5, …, No.4。

图8 158名观察者的分类Fig.8 Categories of 158 observers

3.2 BIGC颜色匹配函数的检验

工作前期基于5个颜色中心、 20对近同色异谱样本对, 组织30名年轻和26名老年观察者开展了色差比较实验[12]。 用3.1节实验优选建立的BIGC-1, BIGC-2, …, BIGC-8颜色匹配函数代入标样和比较样的颜色刺激函数, 计算CIEDE2000色差值, 比较其与目视评价结果的STRESS值[13], 从而表征不同颜色匹配函数的表现。 STRESS值越小, 说明颜色匹配函数的表现性能越好。 同时与CIE1931, CIE1964和分别代入年轻和老年观察者平均年龄22岁和68岁的CIE2006和Sarkar的8个类别颜色匹配函数以及文献[12]中基于CIE1964颜色匹配函数优化建立的BIGC-Young和BIGC-Old进行比较分析, 计算结果如表3所示。

表3 不同颜色匹配函数评价近同色异谱色样对的表现 Table 3 The performances of different CMFs for nearly metameric color samples in terms of STRESS values

表3中, 若对包含BIGC-Young和BIGC-Old在内的22个颜色匹配函数进行测试, 以最小STRESS值出现的观察者个数对观察者进行分类, 结果如表3中Obs.列的数字所示; 若不考虑BIGC-Young和BIGC-Old, 对其余20个颜色匹配函数进行测试, 同样以最小STRESS值出现的观察者个数统计, 结果如表中Obs.列括号中的数字所示, 其中有11名年轻观察者被分类到BIGC-3颜色匹配函数, 而老年观察者中有12名观察者被分类到BIGC-5颜色匹配函数。 BIGC-3计算30名观察者的平均STRESS值为39.5, 仅次于BIGC-Young的结算结果(39.4)。 BIGC-5计算26名老年观察者的平均STRESS值为37.1, 优于BIGC-Old(38.0)和CIE1931(38.4)颜色匹配函数的计算结果。 由此可见, BIGC-3和BIGC-5分别与年轻和老年观察者的目视评价数据具有较好的一致性表现。 同时表3中, CIE推荐的颜色匹配函数并无明显的计算优势, 尤其针对年轻观察者。 同时, 比较表3(打印色之间)和图8(显示色之间)的结果可知, 颜色样本的原色光谱对观察者颜色匹配函数分类具有较大的影响。

比较CIE1964和BIGC-颜色匹配函数的光谱响应曲线, 如图9所示(其中黑色曲线表示CIE1964颜色匹配函数, 红色和品红线分别表示BIGC-3和BIGC-Young的光谱响应曲线, 绿色和青色线分别表示BIGC-5和BIGC-Old的光谱响应曲线)。 表征年轻(BIGC-Young和BIGC-3)和老年观察者(BIGC-Old和BIGC-5)锥细胞光谱响应的颜色匹配函数的主要区别在于 x̅(λ ), y̅(λ ), z̅(λ )三个通道的光谱曲线峰值波长的位移, BIGC-3, BIGC-Young和CIE1964在三个通道的峰值波长位置相同, BIGC-5较BIGC-3和CIE1964均向长波方向有不同程度的位移, 具体峰值波长位置如表4所示。

图9 CIE1964和BIGC-不同颜色匹配函数的光谱分布Fig.9 Spectral distributions of CIE1964 and BIGC-CMFs

将本次聚类分析方法建立的适用于年轻和老年观察者年龄段的分类颜色匹配函数BIGC-3和BIGC-5, 与CIE2006-22和CIE2006-68进行比较, 发现BIGC-3较CIE2006-22在 x̅(λ )通道的第二峰值波长向长波段偏移了约4 nm, BIGC-5颜色匹配函数较CIE2006-68在 x̅(λ )通道的第二峰值波长处、 在 y̅(λ )通道分别向长波段偏移了约4 nm, 在 z̅(λ )通道向短波方向偏移了约4 nm。 分类的BIGC颜色匹配函数在现有CIE2006颜色匹配函数的基础上有了一定的改进和优化, 检验结果表明, 其可更好地用于年轻和老年观察者的锥细胞光谱响应, 今后需要搜集更多的目视评价数据对BIGC-其他类别颜色匹配函数进行分类、 检验。

4 结 论

采用108个颜色匹配函数进行分通道聚类, 在 x̅(λ ), y̅(λ )和 z̅(λ )三个通道分别聚为5类, 组合产生了125个颜色匹配函数。 在iPad三原色显示设备上呈现CIE推荐的17个颜色, 用125个颜色匹配函数和108个颜色匹配函数分别代入17个颜色刺激的光谱能量, 依次比较、 计算不同颜色匹配函数表征17个颜色的CIEDE2000色差平均值。 以CIEDE2000色差最小值进行观察者颜色匹配函数的分类, 按观察者分类个数(/比例)由高到低进行排序, 挑选出125个颜色匹配函数中分类的前10个观察者函数。

将10个分类颜色匹配函数代入基于iPad和Quato三原色显示设备采集到的158组颜色匹配实验数据, 以每组最小CIEDE2000色差值作为评价标准, 进一步挑选出前8类颜色匹配函数(BIGC-1, BIGC2, …, BIGC-8)。 用观察者对近同色异谱色样对的目视色差数据检验8个BIGC颜色匹配函数的表现, 发现BIGC-3适用于表征年轻观察者的锥细胞光谱响应, BIGC-5适用于老年观察者。 无观察者属于BIGC-1, 2, 6, 7, 8。 研究结果可为建立不同年龄分类观察者颜色匹配函数提供计算方法和理论依据, 后期可继续对分类的8个BIGC颜色匹配函数的表现性能进行检验和优化。

参考文献
[1] CIE. CIE Publication 15: 2004. Central Bureau of the CIE, Vienna, 2004. [本文引用:1]
[2] CIE. CIE Technical Report. 2006. 170. [本文引用:1]
[3] Burgos-Fernández F J, Vilaseca M, Perales E, et al. Opt. Appl. , 2016, 46: 117. [本文引用:1]
[4] Asano Y, Fairchild M D, Blondé L, et al. Color Res. Appl. , 2016, 41: 530. [本文引用:1]
[5] HUANG Min, HE Rui-li, SHI Chun-jie, et al(黄敏, 何瑞丽, 史春洁, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析). 2018, 38(7): 2241. [本文引用:1]
[6] Asano Y, Fairchild MD, Blonde L, et al. Proceedings of the IS&T/SID Color Imaging Conference, Society for Imaging Science and Technology, Boston, MA, 2014. 1. [本文引用:1]
[7] HUANG Min, HE Rui-li, GUO Chun-li, et al(黄敏, 何瑞丽, 郭春丽, ). Acta Optica Sinica(光学学报), 2019, 39(1): 0133001. [本文引用:2]
[8] Abhijit Sarkar. Identification and Assignment of Colorimetric Observer Categories and Their Applications in Color and Vision Science. Rennes, France Université De Nantes, 2011. [本文引用:1]
[9] Stiles W S, Burch J M. Journal of Modern Optics, 1959, 6: 1. [本文引用:1]
[10] Johnson R, Wichern D. Hand book of Applied Multivariate Statistical Analysis (Pearson Education International, NJ), USA, 2007, 6th ed. [本文引用:2]
[11] Witt K. Color Research & Application, 1995, 20(6): 399. [本文引用:1]
[12] HUANG Min, HE Rui-li, GUO Chun-li, et al(黄敏, 何瑞丽, 郭春丽, ). Acta Optica Sinica(光学学报), 2018, 38(3): 033301. [本文引用:2]
[13] Garcia P A, Huertas R, Melgosa M, et al. J. Opt. Soc. Am. A, 2007, 7: 1823. [本文引用:1]