v1.2 附:此版本数据中的各朝代人名高频字词演变


由于此版本对女性姓名做了非常朴素的过采样(重复计数),导致部分偏向于女性用字的字频率比直觉要高,占据高频字的前列。故以下图表的内容仅供参照,准确性不大,不足以反映真实历史,不可用于专业研究、学习。

但其实这类高频字的计数远不如姓氏(几十与几百的差距,几十次的计数又来源于平均十次的重复统计),因此与低频字的差距也远不如姓氏,过采样后的分布还是没有太离谱的。熵值中亦可以看出,姓氏的概率分布更集中在高频姓氏上。

表1 与上一版本姓、名的熵值对比总览,log底数为2(注:上一版本中未将单名与双名的第一部分完全分开,仅独立统计了单名的数据,故第一行为单名+双名的第一部分的综合计数。而下文此版本的高频字词趋势图中,名字一已经独立拆分为单名和非单名的两部分)

v1.2(现版本)v1.1(上版本)
名字一(包括单名) 10.12 > 10.03
名字一(单名) 10.76 > 10.29
名字二 9.92 > 9.26
姓氏 7.21 > 7.08

图1 此版本的各朝代高频姓氏

图2 此版本的各朝代高频单名

图3 此版本各朝代的双名第一部分高频字词

图4 此版本各朝代的双名第二部分高频字词

Get 古代人名生成器: Ancient Chinese Name Generator

Leave a comment

Log in with itch.io to leave a comment.