当前位置:首页 > 开发 > 数据库 > 正文

浅薄葬送了中国人自己的智慧 - 终于明白本科的《数据库》课程为什么我考不及格了

发表于: 2006-03-08   作者:歆渊   来源:转载   浏览:
摘要: 一切缘起于思维模式的差别. 最近因为自己在开发对象数据库软件, 所以对相关学科现状进行了比较深入的了解, 前不久就惊奇的发现原来这30年里统治关系数据库技术的 实体/关系模型 其实源出一位华人前辈 Peter Chen (陈品山)之手, 他曾就读于卡内基梅隆大学, 后在麻省理工,加州大学洛杉矶分校和哈佛大学出任访问教授, 现任教于路易斯安那州立大学计算机科学系.  在后来更多的

一切缘起于思维模式的差别.
 
最近因为自己在开发对象数据库软件, 所以对相关学科现状进行了比较深入的了解, 前不久就惊奇的发现原来这30年里统治关系数据库技术的 实体/关系模型 其实源出一位华人前辈 Peter Chen (陈品山)之手, 他曾就读于卡内基梅隆大学, 后在麻省理工,加州大学洛杉矶分校和哈佛大学出任访问教授, 现任教于路易斯安那州立大学计算机科学系.
 
在后来更多的阅读中了解到, 在陈教授提出该模型获得巨大成功之后, 也有很多同行朋友问起他怎么居然能想到这么优秀的理论, 而他反复思考以后得出的结论是: 很可能要归于中华的文化传承, 他举例说汉字的多种造字法, 将之与拼音文字比较, 同时发现了古埃及文字与汉字的惊人相似之处. 它们都是巧妙的仿效和利用了大自然的事物模型来阐释语义. 汉语文字其实已经是一种对自然界万千事物的很好的建模.
 

http://bit.csc.lsu.edu/~chen/papers.html

http://bit.csc.lsu.edu/~chen/pdf/erd.pdf

*The Entity-Relationship Model--Toward a Unified View of Data (only the first 5 pages of the 28-page paper)
ACM Transactions on Database Systems, Vol. 1, No. 1, March 1976, Pages 9 - 36  (file size: 1.68 Meg bytes) .  (Note: only the first 5 pages of the paper are provided here.  For the full paper, please download it from the ACM Digital Library by searching “Peter Pin-Shan Chen” or “Peter Chen”. ) (This paper is one of the most cited papers in the computer field.  It was selected as one of the most influential papers in computer science in a survey of over 1,000 computer science professors.)

 

这两天出于偶然的考虑决定仔细读一遍陈教授这篇广为征引的巨著, 着实所获匪浅. 最为撼动的是这篇论文发表时间是1976年, 比我还大了三岁, 到现在已经过去三十年了. 经历了这三十年IT技术风起云涌, 突飞猛进的岁月, 这个模型却未经多大改动, 仍然被广泛使用. 感慨它作为计算机科学如此的中流砥柱, 恒久不衰的同时, 也增加了一些有所突破的信心, 毕竟30年对日新月异的计算机技术来说绝对称得上是大限了.
 
同时也了解到, 在E/R模型之前, 已经有3种主流数据模型: 网络模型, 关系模型和实体集合模型, 同时发现那时候已经有了初具形态的SQL语言. 网络模型缘起于计算机数据结构, 是离计算机实现最近的模型. 关系模型和实体集合模型则基于数学上的关系论和集合论, 极为抽象.
 
值得一提的是通常被我们翻译为 "关系模型" 的 "Relational Model", 我觉得更应该把它翻译为 "泛关系模型", 不仅因为它本身是把一切都看作一系列域的具体取值所构成的元组, 即它的"Relation", 更是由于现有的翻译给中国的计算机业者带来了实质的混淆和损失, 在一些关键场合把 "泛关系模型" 与 "实体/关系模型" 混为一谈. 包括认识到这个问题之前的我在内, 凡是学习过数据库理论课程的人恐怕都熟知关系数据库的Normalization过程, 用来衡量其结果的第1到第5范式(Normal Form, 简称 1NF, 2NF, 3NF...) 以及 BCNF. 甚至还有很多人以此津津乐道, 作为考题等等, 更有甚者拿来作为学问的炫耀. 然而, 这个过程和诸多的NF却完全是 "泛关系模型" 所特有的东西. 三十年前, 陈教授的这篇 "one of the most cited papers in the computer field" 所要明确阐明的其中一个事实, 正是说一个 实体/关系模型, 不需要变换操作就已经直接是类似于3NF, 并且语意更加清晰的模型. 原文是: We shall show that the entity and relationship relations in the entity-relationship model are similar to 3NF relations but with clearer semantics and without using the transformation operation (P28, The Entity-Relationship Model-Toward a
Unified View of Data, PETER PIN-SHAN CHEN).
 
直到三十年后的今天, 不知还有多少人仍将3NF视为金科玉律, 拿来衡量和评价一个数据库方案设计, 而且不排除很多计算机届的专家和学者. 我觉得作为西方人仍然沿用 "泛关系模型" 以及 "泛关系论" 来完成设计工作不足为奇, 因为从他们的文化背景就决定了他们很难从思维中直接把自然事物转换为 "实体/关系模型". 他们的办法是发展抽象数理方法, 得出一些简单原则, 然后逐步推演. Database Normalization正是这样一个过程. 可以说, 就这样抽象推导和演算成了西方人的长处. 但是作为一个东方人来说, 如果没有仔细的研究看透模型背后的奥妙, 恐怕就只能以 "浅薄" 来形容了, 至少没有认真读懂陈前辈的这篇精彩著作, 甚至根本没有想过去读. 缺乏这种钻研精神本身就足够冠以 "肤浅" 的形容了.

同时我也明白了本科时候《数据库》这门课为什么考不及格了, 我的思维方式主要靠形象影射, 很多时候是在大脑里绘一些直观的动画来计算和设计, 学过的理论是把它融化于大脑里, 真正的思维和设计都是用自然, 直观的形象推演和表达(像陈教授讲的汉字的构成法), 从来不以公式为主线方向. 可能并不是每个人都这样思考, 因为我中学的物理老师曾经说看到我在下面做题的时候只是闭上眼睛去想, 等别人在本子上画图,列式子演算出结果的时候, 我早就直接写出正确答案的数字了. 不过我相信我是按照中华古文化的 "人天合一" 的思想来考虑问题的, 法天地, 法万物. 所以我高数也学不好, 因为它的公式跟自然少有联系. 然而《数据库》这门课的教材却不清不白的把各种模型和方法罗列了个大概, 考试也更多的是这些概念和演算题目. 所以现在想想, 当时考不过也不算丢脸了. 其实IT方面中文翻译资料的浅薄和劣质是一个普遍现象, 本来东方式思维对抽象理论的理解就相对西方人更弱, 加上缺乏深刻的东方式的思考和科研 -- 我们其实正在葬送大自然赋予我们的伟大东方智慧!

 

三十年前, 陈前辈以旅美华人的身份成功用自然模型打破了计算机模型与数学模型的僵局.

三十年后, 我要以一个本土中国人的身份, 用自然模型打破面向对象模型与非面向对象模型的僵局.

 

Ableverse 5 TOB 正是一个以面向对象为基础, 萃取了网络模型的高效与关系模型的成熟简明而融合成的新一代高性能对象数据库系统. 它所提出的 对象/关系/亲系 模型也正是一个更好的反映出自然事物关系的数据模型. AV5TOB 的发布已经指日可待.

 

另外想对国家对科研机构的投资和管理机制抱怨一下, 不要总是让我这样的 "民科" 来做这样的事情了, 这是很富戏剧性的. 我有在国内著名高校实验室工作的朋友因为常常是在做只拿钱不干活的事情, 都开始怀疑人生的价值了.

浅薄葬送了中国人自己的智慧 - 终于明白本科的《数据库》课程为什么我考不及格了

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号