Sunday, December 5, 2010

说说籍贯

早上醒来,躺在床上,忽然想起一个有趣的问题。在中国的许多身份文件中,都有籍贯这么一栏,而在西方的身份登记中,通常只要求等级出生地和现居住地(或曾居住地)。大致想来,这也许反映了中国旧时代和现代(西方)社会人员流动程度的差异。

籍,在中国古汉语中表示一个家庭对朝廷担负徭役的类型,通常由其当家的职业决定。贯,是指一个人生长的地方。在人们的概念中,籍贯通常是指一个人的祖居地。在中国旧时代,由于人员流动很少,确定籍贯也许不是一件难事。许多家庭祖祖辈辈生于斯、长于斯。我猜想,籍贯一栏也就因此沿用下来的。

在现代生活中,人员流动频繁。记得有一个统计,美国人一辈子平均在6个州迁移。中国现代社会也充满了变化。上海居民中有多少祖籍是上海的呢?于是,籍贯就变得模糊和难以确定了。

在网上查了一下,才知道香港和台湾已相继逐步取消籍贯一栏,而采用出生地的信息。这是跟随西方个人信息采集口径的做法。

大陆采用以下规定:“按照公安部公通字[1995]91号文件规定,公民的籍贯应为本人出生时祖父的居住地(户口所在地);祖父去世的,填写祖父去世时的户口所在地;祖父未落常住户口的,填写祖父应落常住户口的的地方;公民登记籍贯后,祖父又迁移户口的,该公民的籍贯不再随之更改。” 如果籍贯都按以上规定严格填写的话,倒是非常有趣:我们会得到一个跨代的迁移链。

假定六代人:甲、乙、丙、丁、戊、己。根据规定,丙的籍贯采用甲的户籍,戊的籍贯采用丙的户籍。单从籍贯上看,甲、丙、戊形成一条链,与乙和丁无关。乙、丁、己形成一条链,与甲、丙、戊无关。

出生地、户籍和籍贯提供了对一个人迁徙的多个时间点信息:出生地、生育子女时的所在地(由子女的出生地信息获得)、和子女生育时的这个人的所在地(由孙辈的籍贯信息获得)。

当然,以上的数据挖掘框架是不太靠得住的,因为许多人在填写籍贯信息时并不严格按照规定来。

No comments:

Post a Comment