首页 > 文章中心 > 正文

人工智能书刊中符号和公式编排探思

人工智能书刊中符号和公式编排探思

摘要:当前,新一代人工智能正在全球范围内蓬勃发展,带来人工智能类书刊文章近几年以几何级倍数增加。本文针对国内人工智能类书刊文章中符号和公式编排的常见问题,结合国家标准进行思考并给出规范的表达方式,以期对作者和出版社编辑有所启发,提高相关出版物的质量。

关键词:人工智能;书刊文章;符号;公式;编辑加工

导语

当前,新一代人工智能正在全球范围内蓬勃发展,促进人类社会生活、生产和消费模式巨大变革,为经济社会发展提供新动能,推动经济社会高质量发展,加速新一轮科技革命和产业变革。2017年,国务院《新一代人工智能发展规划》,目标是抢抓人工智能发展的重大战略机遇,让我国在人工智能领域构筑先发优势。我国顶级的IT企业和一流高校陆续成立协同创新中心、人工智能研究院、人工智能学院等机构。教育方面,《新一代人工智能发展规划》提出“实施全民智能教育项目,在中小学阶段设置人工智能相关课程,逐步推广编程教育”的要求。不少省、区、市都已经开始探索在义务教育阶段开展人工智能教育。人工智能高等教育更是走在前列。2018年,教育部印发了《高等学校人工智能创新行动计划》,将完善人工智能领域人才培养体系作为三大任务之一,并积极加大人工智能专业建设力度。在这些背景下,我国的人工智能类书刊文章近几年以几何级数增加,给出版单位的编辑提出了新的要求和挑战。从人工智能的理论基础来看,一方面,人工智能脱胎于计算机学科,是研究使用计算机来模拟智能的科学,需要用计算机程序实现这些智能应用;另一方面,当前以深度神经网络为代表的新一代人工智能又是建立在以线性代数和概率论为框架的基础数学之上,通过在多维上简单地组合实现复杂的功能。因此,在人工智能类书刊文章中不可避免地会碰到大量的数学公式、物理量符号、计算机算法和程序段代码交织在一起的情况,给编辑加工带来一定的困扰。本文主要谈谈编辑加工人工智能书刊文章中的符号和公式时遇到的几个典型问题,并简单进行总结和归纳。[1]

1.人工智能类书刊文章中的大、小写

人工智能类书刊文章中的大、小写表示,除了人名、地名、机构等专有名词的英文释义需要首字母大写,名词英文缩写、部分运算符号、人名引申的单位符号、集合符号等全部大写外,其他的英文字符均建议用小写表示。这和一般科技类书刊文章中的表示是统一的,下面举几个人工智能文章中的例子做具体说明。例1(1)Python语言、GPU、LeNet神经网络——这些都是与人工智能相关的专有名词或专有名词缩写,有些已经收入相关的《专有名词词典》或者在“术语在线”上能查到,但也有相当一部分还没有,但是可以按照约定俗成来表示。(2)支持向量机(supportvectormachine,SVM)卷积神经网络(convolutionalneuralnetworks,CNN)——人工智能书刊文章中出现的算法、方法、公式名称的英文释义一般全用小写表示,缩写一般全用大写表示。(3)隐马尔科夫模型(hiddenMarkovmodel,HMM)、蒙特卡洛树搜索(Monte-Carlotreesearch)——英文释义中涉及人名或者地名等专有名词,专有名词保持首字母大写,其他单词用小写表示,缩写还是全用大写。(4)国际计算机视觉大会ICCV(IEEEInternationalConferenceonComputerVision)——顶级会议和机构名称的英文释义保留首字母大写。人工智能类书刊文章中的大、小写表示一般是遵循约定的原则而非通用标准,所以尺度比较宽松,编辑加工中做到同一类情况全书或全文统一也就可以了。

2.人工智能类书刊文章中的正、斜体

2.1量和单位

人工智能类书刊文章中的量和单位首先要符合一般性的量和单位正规表达方式。[2]量的符号,包括物理量和计算过程中用到的变量,通常是单个的拉丁字母或希腊字母,都必须用斜体表示,如x,y,z,W,α,β,Θ等。有一种情况容易忽略,即变量出现在名词中,如人工智能类书刊文章中会出现k-均值(k-mean)算法、n元语法(n-gram)模型等名词,其中的k和n表示为变量,所以不管是在中文名称还是英文释义中都应该用斜体表示。单位符号则一律用正体表示,如厘米(cm)、千克(kg)等。人工智能书刊文章中还经常会遇到计算机中常用的单位,如比特(b)、比特率(b/s)、千比特每秒(Kb/s)、字节(B)、千字节(KB)、兆字节(MB)等。特别要注意小写k、m和大写K、M作为SI词头(加在单位前的符号)的用法,一般来说,103=k,10-3=m,106=M,但在计算机二进制中还有210=K,220=M,所以要根据上下文的准确意思来标注单位符号。人工智能书刊文章中的单位符号还有几个通用原则需要遵循。(1)作为科技书籍或文献,单位符号一般应全部使用英文符号,不能中文英文单位混用,除非该量只有中文单位,如计数单位“元”“人”“册”等,计时单位“时辰”“旬”等,因为没有对应的字母符号,所以只能用中文符号。(2)多个具有共同单位的数值并列或区间表示时,可以只在最后一项数值后保留单位符号,其他数据后省略,例如,100、200、500HZ(或100,200,500HZ),100~500b/s,1991—1995年等。(3)多个数值相乘表示面积、体积、分辨率时,每个数值的单位都应该保留,例如,体积2m×5m×3m,分辨率800px×600px等。这和上文“多个具有共同单位的数值并列”是有明显区别的,需要特别注意。

2.2函数、常数及运算符号

数学公式中常见的函数、常数及运算符号一律用正体表示,如sin,cos,∑,∏,log,ln,Δ,π,e(自然对数底)等。微分号“d”和偏微分号“∂”本文认为也是运算符号的一种,所以应该用正体表示。要注意的是,不能见着符号e就把它排成正体,一定要明白它代表的数学意义,e作为字母变量时应该用斜体表示,同样的情况还是有π,∑等,这些符号也常用作变量。人工智能用到的公式除高等数学外,还涉及统计学的内容,例如统计机器学习部分的内容。统计学的运算符号一般用斜体表示,还应注意大、小写的表示规则,如概率计算为大写斜体P,算数平均数计算使用大写斜体M,总体的标准差计算用小写斜体σ等。人工智能类书刊文章中还有一类特殊的函数——激活函数,如softmax,logistic,sigmoid,tanh,ReLU等,实际处理中,作为一般的数学函数对待,不管是在正文中还是在公式中,都用正体表示。

2.3上、下标的正、斜体

一般原则是,物理量符号或者在计算过程中用到的变量符号出现在上、下标的时候使用斜体表示,其他均应用正体表示。[3]例2Wij,其中的ij是双变量符号,使用斜体表示;Wi,Wo,其中i,o表示物理量的输入、输出状态,使用正体表示;WT,其中的T是时间变量,使用斜体表示;WT,其中的T表示矩阵的转置,使用正体表示。人工智能类书刊文章中变量的上、下标还会用到函数符号,如果是标准数学函数或特定的函数符号,如sin(正弦),max(最大),lim(极限),exp(以e为底的指数函数),tanh(双曲正切)等,均用正体表示。但是,很多作者也会用到自定义的函数符号做变量的上、下标,一般来说自定义的函数在公式计算中用斜体表示,因此,用作变量的上、下标时也用斜体表示,如等。

2.4计算机程序中的正、斜体

人工智能类书刊文章中还会遇到大量的程序代码,计算机执行程序时一般不区分正、斜体,所以程序代码编排时不管是变量还是常量一律用正体表示。通常,为表述一致,程序段的注释部分(用“#”或“/*”等标注)出现的变量也一律用正体表示,但如果在两个程序段中间出现的没有用“#”或“/*”等标示的语句,可以认为是正文,其中出现的变量还是要用斜体表示。

3.人工智能类书刊文章中的黑、白体

3.1矢量、向量、张量和矩阵

《量和单位国家标准实施指南》[4]中规定:矢量、向量、张量和矩阵用黑斜体表示。人工智能类书刊文章中的公式会大量用到向量、张量、矩阵,但作者在写作的时候往往会忽略标注黑体,编辑因为专业知识的限制,有时也很难判断某些量是标量还是向量、矩阵、张量。[5]简单的方法就是从上下文信息判断出某些量的属性,例如,判断矩阵的直观方法有转置(T)、取模(║·║)等运算,再由这些已知的量推导出其他量的性质。但是,人工智能类书刊文章中大部分的量都无法这么简单判断,本文根据编辑此类书刊文章的经验以及与相关作者的交流沟通,以机器学习和神经网络为例给出一些编辑加工思路。单特征的回归网络,本质上就是一元线性问题,其计算公式就是一个线性方程:zi=xi·w+bw和b都是一个标量,每个特征x对应一个输出z,所以都是白体。多特征的回归网络,其计算公式也可以简单归纳为一个线性方程:Z=WTX+B其中,X=,即多个特征向量的矩阵,所有都是黑体。往后,更复杂的计算模型,例如多特征的多分类问题以及深度学习问题,样本数肯定大于2,甚至是多维数据,所以输入和输出都应该是矩阵或张量,特征数也肯定多于一个,甚至是多维特征,所以特征和偏置也都是矩阵或张量,都应该用黑体表示。[6]例如,对具有n个训练数据{(x1,y1)…,(xn,yn)}的神经网络,其中(xi,yi)(1≤i≤n)分别为输入样本及其对应的标签,都是向量表示。对该神经网络进行优化,一般需要计算该神经网络的损失函数,可表示为Loss(yi,f(W,xi))。其中,Loss是损失函数符号,因为是自定义函数,此处用的是斜体;f(W,xi)表示参数为W的神经网络对输入xi的预测,对卷积神经网络而言,W表示神经元连接权重和卷积核权重等需要学习的参数。此外有个细节要特别小心,即使判定变量为向量、张量、矩阵,也不要一股脑地把此变量整个排成黑体,要注意上、下标的量的属性。只有同样是向量、张量、矩阵的上、下标才需要排成黑体,其余仍是白体。例如,Loss(yi,f(W,xi))中,虽然y和x都是用黑斜体表示,但下标i是用白斜体表示。

3.2集合

集合一般都是用大写拉丁字母的白体表示,如A,B,X,Y,Z等,但某些特殊的集合符号需要用黑正体或空心正体(或花体)形式表示,如N或N(非负整数集),Z或Z(整数集),R或R(实数集)等。但要特别注意是集合内的元素有可能是向量或张量,这在人工智能类书刊文章中非常常见,例如输入数据集合X={x1,x2,x3,…,xn},这时,很多作者在写书过程中容易直接把X集合标成黑体并直接代入后面算式进行计算,混淆了数据集合和数据矩阵。其实,数据集合和数据是两个不同的概念,集合只能参与集合运算,不能参与普通运算,直接写进公式就写错了。碰到此类情况,本文有如下一种编辑加工时的修改方案。定义数据集合X={x1,x2,x3,…,xn},注意X是大写的白体,另定义小写黑体x=(原则上另定义大写黑体X也可以,但是同时出现不好区分,也使读者疑惑)或者xi(i=1,…,n)代表数据代入公式进行运算。这里的x或xi不再表示集合而是表示数据矩阵或单个数据向量、张量。可见,符号和公式的正、斜、黑、白体看似不起眼,实则非常重要,有时不仅仅是规范性问题,还是科学性问题。[7]

4.公式、算法伪代码和程序段混排中的处理

能正确标注公式中的正、斜、黑、白体已经很难了,如果再碰上公式、算法伪代码和程序段混排的情况,那就更容易混淆了。下面通过一个例子来说明本文的处理方式。例3如果使用深度神经网络来拟合动作─价值函数,则该算法被称为深度Q学习。……,是对的估计值,……,利用梯度下降法来更新参数θ。算法参数化的Q学习算法函数:DeepQLearning输入:马尔可夫决策过程输出:策略π此例中的θ,从上下文来看是个多维参数,必然是向量或张量,所以正文中用黑斜体表示。本文认为算法伪代码也是正文的一种形式,只不过加入了repeat、until、for、goto这样的伪语句(伪语句的编排向程序段靠拢,用正体表示),所以期内的公式表述还是应该和普通正文表述保持一致。所以此例中出现的θ都统一用黑斜体表示。如果算法伪代码后面还接了一段Python程序,其中定义了同一个变量θ,按照前文所述原则,程序内的θ按照正白体处理。[8]

5.小结

以上分析了人工智能类书刊文章中常见的符号使用和公式编排问题,并给出了规范性的思考。但符号和公式使用的实际情况要复杂得多,特别是人工智能涉及的公式都是抽象公式,其中变量的一符多用或多符共用的情况普遍存在,用好用准并不容易。作者和编辑要在熟悉规范的前提下,根据知识内容的实际情况,准确表达,一起提高此类书刊文章中符号和公式使用的规范性,提高成果质量,为我国新一代人工智能的发展保驾护航。

参考文献

[1]国家技术监督局.GB3100~3102–93量和单位[M].北京:中国标准出版社,1993.

[2]国家技术监督局.量和单位国家标准实施指南[M].北京:中国标准出版社,1996.

[3]陈天骄,刘江,黄韬.人工智能在网络编排系统中的应用[J].电信科学,2019(5):9-16.

[4]姚琼.科技期刊中数学公式编排的常见问题分析[J].中国多媒体与网络教学学报(上旬刊),2019(10):247-248.

[5]叶超.关于减少数学类文章编排错误的几点思考[J].科技创新与生产力,2017(1):64-66.

[6]论文中公式和反应式的编排规范[J].电力系统及其自动化学报,2011(3):110.

[7]王萌.浅析科技期刊中数学公式编辑加工常见问题[J].中国传媒科技,2020(9):96+104.

[8]朱建新.国内外科技期刊中数学符号编排格式的对比分析[J].编辑学报,2019(01):34-36.

作者:韩飞 单位:高等教育出版社