关于这两个比赛的准备,主要分三点吧:选队友及分工、算法准备、论文准备
· 选择队友及分工:
选择队友很重要。首先要保证你们能做到各有所长,分工明确,一般来说,三人的比赛一般是一人负责建模写代码,一人负责理论基础,一人负责论文;当然这里所说的分工只是侧重而不是唯一,因为实际上很多工作需要合作完成。
· 准备:
准备的话看个人基础与重视程度,楼主自己带的队伍是开赛前10天左右准备的,也就是每天花半个小时左右看历年的优秀论文,然后小组内交流分享。当然楼主了解到身边拿O奖的某只队伍是6个月前就开始准备的(对于这样的毅力,只能默默点赞)。
主要准备的有这两个方面:算法、论文写作。作为队长的话需要关注一下比赛过程中如何控制每个环节的时间,以及时刻保持和队员的沟通,避免工作的重复,低效。
算法准备上,楼主主要使用Matlab编程,准备的内容包括几个方面:
o 目标规划问题:整数规划、线性规划、非线性规划、动态规划
o 数据分析:方差分析、回归分析、层次分析法、判别分析、多元分析
o 数据处理:插值、拟合、筛选、预测
o 优化算法:遗传算法、模拟退火算法、神经网络
o 图与网络:Dijkstra、Floyd、Prim、Bellman-Ford,最大流
o 方程建模:微分方程、偏微分方程、差分方程
o 模糊数学模型
o 概率方法:蒙特卡洛法
o 以及一些常用的方法
论文写作的话要准备这样几点:
o 论文格式规范:这个主要就是阅读参考书籍
o 优秀论文参考:结合题目,阅读历年优秀论文
o 论文排版工具:可以选择word也可以选择latex,Latex比较专业,排版美观,但是也需要提前学习,当然,一般来说比赛之前会有人出比赛的Latex模板,只需要下载模板到时候直接套用即可,不过需要注意的是,如果对Latex完全不熟悉的话不建议使用,因为套模板可能出现意想不到的问题,这时不熟悉Latex的话可能导致前功尽弃。
· 几点经验
·
o 严格控制时间节点。这点很重要!!!一定要意识到在建模上花更多时间导致最后论文没有体现结果这是非常不明智的,楼主的前两次比赛就是在建模上花了太多时间,导致论文没时间认真撰写和修改优化,结果就是你做的可能比别人多,比别人好,但是你没有呈现出来,died~)
o 明确分工。拿到一个问题形成思路之后很难做到模块化分工,这时按照主次分工,主线一个人在走,而中间的小问题可以交给另一个队友,当然,一般来说可以按照题目的问题来做划分。还有一点就是,从选定题目开始,负责写论文的队友即可开始论文的撰写,包括框架,前言后续等内容。
o 密切沟通。这个问题很重要,组内必须保持密切沟通,你可以不了解组员实现问题的具体细节,但是你必须了解思路及过程,否则,写出来的论文注定一盘散沙。
o 带动组内的气氛。比赛时本来就比较紧张,这时作为组长需要特别关注组员的状态,让大家重视但也不要过于紧张,特别是最后一天大家都累趴下的时候,这时组长的角色就显得尤为重要。
o 关注官网上的各个时间节点。作为组长,必须了解比赛的各个时间节点,比如什么时候提交选题,什么时候提交论文,什么时候提交承诺书等等,还有就是不能按照官网的最后时间节点提交,因为那时网络会挤到爆炸,楼主第一次美赛时就是最后一个小时提交的论文,通宵到第二天8点,组员们直接累趴下,而看着官网一遍遍的刷新失败,心里真是难以言表的苦楚,要是只是自己的比赛失败了也罢,可是这是组员们几天的心血啊,看着累趴的组员,真是心疼,那时真想抽自己大嘴巴子。。。不过所幸最后还是成功提交了。
数学建模中常用的方法:类比法、二分法、差分法、变分法、图论法、层次分析法、数据拟合法、回归分析法、数学规划(线性规划,非线性规划,整数规划,动态规划,目标规划)、机理分析、排队方法、对策方法、决策方法、模糊评判方法、时间序列方法、灰色理论方法、现代优化算法(禁忌搜索算法,模拟退火算法,遗传算法,神经网络)。
这些方法可以解一些模型:优化模型、微分方程模型、统计模型、概率模型、图论模型、决策模型。
拟合与插值方法(给出一批数据点,确定满足特定要求的曲线或者曲面,从而反映对象整体的变化趋势): matlab可以实现一元函数,包括多项式和非线性函数的拟合以及多元函数的拟合,即回归分析,从而确定函数; 同时也可以用matlab实现分段线性、多项式、样条以及多维插值。
在优化方法中,决策变量、目标函数(尽量简单、光滑)、约束条件、求解方法是四个关键因素。其中包括无约束规则(用fminserch、fminbnd实现)线性规则(用linprog实现)非线性规则、( 用fmincon实现)多目标规划(有目标加权、效用函数)动态规划、整数规划。
回归分析:对具有相关关系的现象,根据其关系形态,选择一个合适的数学模型,用来近似地表示变量间的平均变化关系的一种统计方法 (一元线性回归、多元线性回归、非线性回归),回归分析在一组数据的基础上研究这样几个问题:建立因变量与自变量之间的回归模型(经验公式);对回归模型的可信度进行检验;判断每个自变量对因变量的影响是否显著;判断回归模型是否适合这组数据;利用回归模型对进行预报或控制。相对应的有 线性回归、多元二项式回归、非线性回归。
逐步回归分析:从一个自变量开始,视自变量作用的显著程度,从大到地依次逐个引入回归方程:当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉;引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步;对于每一步都要进行值检验,以确保每次引入新的显著性变量前回归方程中只包含对作用显著的变量;这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。(主要用SAS来实现,也可以用matlab软件来实现)。
聚类分析:所研究的样本或者变量之间存在程度不同的相似性,要求设法找出一些能够度量它们之间相似程度的统计量作为分类的依据,再利用这些量将样本或者变量进行分类。
系统聚类分析—将n个样本或者n个指标看成n类,一类包括一个样本或者指标,然后将性质最接近的两类合并成为一个新类,依此类推。最终可以按照需要来决定分多少类,每类有多少样本(指标)。
系统聚类方法步骤:
计算n个样本两两之间的距离
构成n个类,每类只包含一个样品
合并距离最近的两类为一个新类
计算新类与当前各类的距离(新类与当前类的距离等于当前类与组合类中包含的类的距离最小值),若类的个数等于1,转5,否则转3
画聚类图
决定类的个数和类。
判别分析:在已知研究对象分成若干类型,并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。
距离判别法—首先根据已知分类的数据,分别计算各类的重心,计算新个体到每类的距离,确定最短的距离(欧氏距离、马氏距离)
Fisher判别法—利用已知类别个体的指标构造判别式(同类差别较小、不同类差别较大),按照判别式的值判断新个体的类别
Bayes判别法—计算新给样品属于各总体的条件概率,比较概率的大小,然后将新样品判归为来自概率最大的总体
模糊数学:研究和处理模糊性现象的数学 (概念与其对立面之间没有一条明确的分界线)与模糊数学相关的问题:模糊分类问题—已知若干个相互之间不分明的模糊概念,需要判断某个确定事物用哪一个模糊概念来反映更合理准确;模糊相似选择 —按某种性质对一组事物或对象排序是一类常见的问题,但是用来比较的性质具有边界不分明的模糊性;模糊聚类分析—根据研究对象本身的属性构造模糊矩阵,在此基础上根据一定的隶属度来确定其分类关系 ;模糊层次分析法—两两比较指标的确定;模糊综合评判—综合评判就是对受到多个因素制约的事物或对象作出一个总的评价,如产品质量评定、科技成果鉴定、某种作物种植适应性的评价等,都属于综合评判问题。由于从多方面对事物进行评价难免带有模糊性和主观性,采用模糊数学的方法进行综合评判将使结果尽量客观从而取得更好的实际效果 。
时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列—通过对预测目标自身时间序列的处理,来研究其变化趋势(长期趋势变动、季节变动、循环变动、不规则变动)
自回归模型:一般自回归模型AR(n)—系统在时刻t的响应X(t)仅与其以前时刻的响应X(t-1),…, X(t-n)有关,而与其以前时刻进入系统的扰动无关 ;移动平均模型MA(m)—系统在时刻t的响应X(t) ,与其以前任何时刻的响应无关,而与其以前时刻进入系统的扰动a(t-1),…,a(t-m)存在着一定的相关关系 ;自回归移动平均模型 ARMA(n,m)—系统在时刻t的响应X(t),不仅与其前n个时刻的自身值有关,而且还与其前m个时刻进入系统的扰动存在一定的依存关系 。
时间序列建模的基本步骤
数据的预处理:数据的剔取及提取趋势项
取n=1,拟合ARMA(2n,2n-1)(即ARMA(2,1))模型
n=n+1,拟合ARMA(2n,2n-1)模型
用F准则检验模型的适用性。若检验显著,则转入第2步。若检验不显著,转入第5步。
检查远端时刻的系数值的值是否很小,其置信区间是否包含零。若不是,则适用的模型就是ARMA(2n,2n-1) 。若很小,且其置信区间包含零,则拟合ARMA(2n-1,2n-2) 。
利用F准则检验模型ARMA(2n,2n-1)和ARMA(2n-1,2n-2) ,若F值不显著,转入第7步;若F值显著,转入第8步。
舍弃小的MA参数,拟合m<2n-2的模型ARMA(2n-1,m) ,并用F准则进行检验。重复这一过程,直到得出具有最小参数的适用模型为止
舍弃小的MA参数,拟合m<2n-1的模型ARMA(2n,m) ,并用F准则进行检验。重复这一过程,直到得出具有最小参数的适用模型为止。
图论方法:
最短路问题:两个指定顶点之间的最短路径—给出了一个连接若干个城镇的铁路网络,在这个网络的两个指定城镇间,找一条最短铁路线 (Dijkstra算法 )每对顶点之间的最短路径 (Dijkstra算法、Floyd算法 )。
最小生成树问题:连线问题—欲修筑连接多个城市的铁路设计一个线路图,使总造价最低(prim算法、Kruskal算法 )。
图的匹配问题:人员分派问题:n个工作人员去做件n份工作,每人适合做其中一件或几件,问能否每人都有一份适合的工作?如果不能,最多几人可以有适合的工作?(匈牙利算法)。
遍历性问题:中国邮递员问题—邮递员发送邮件时,要从邮局出发,经过他投递范围内的每条街道至少一次,然后返回邮局,但邮递员希望选择一条行程最短的路线
最大流问题。
运输问题:
最小费用最大流问题:在运输问题中,人们总是希望在完成运输任务的同时,寻求一个使总的运输费用最小的运输方案
在数学建模中常用的算法:
1:蒙特卡罗算法;
2:数据拟合、参数估计、插值等数据处理算法(常用matlab实现);
3:线性规划、整数规划、多元规划、二次规划(用lingo、lingdo、matlab即可实现);
4:图论算法(包括最短路、网络流、二分图);
5:动态规划、回溯搜索、分治算法、分支界定;
6:最优化理论的三大经典算法(模拟退火算法、神经网络算法、遗传算法);
7:网格算法和穷举法;
8:连续数据离散化;
9:数值分析算法;
10:图象处理算法(常用matlab来实现)。
五步方法
五步方法顾名思义,通过五个步骤完成用数学模型解决实际问题。它包含以下五个步骤:
提出问题
选择建模方法
推导模型的数学表达式
求解模型
回答问题
第一步是提出问题,即对遇到的实际问题使用恰当的数学语言进行表达。一般而言,首要任务是对术语进行定义。无论是实际问题涉及到的变量,还是这些变量的单位、相关假设,都应当用等式或者不等式进行表达。在这一基础上,我们就可以用数学语言对实际问题进行转述,并构成完整的问题。其中变量与参量的区别是很重要的,需要区分开来。完成第一步之后,可以归纳得到一个包含变量、假设、目标的列表。列表中可以清楚明显地看出问题包含的变量,由题目得到的关系式,以及目标。判断第一步是否成功完成的主要依据便是,目标能否转化为某一变量的函数。
第二步是选择建模方法。在第一步的基础上我们将问题用数学语言表达了出来。第二步的目的便是选择一个数学方法来获得解。换言之,想要正确完成这一步骤需要足够多的经验或者熟悉参考文献。
第三步是推导模型的公式。在第一步中我们完成了对术语的定义,并使用数学语言将问题表达出来;在第二步中我们根据第一部分所得到的结论,选择了合适的建模方法。而每一种建模方法都有其所需要的标准形式。第三步的主要目的就是将第一步中的数学表达式变形为第二步中的建模方法的标准形式,以便于利用该模型的算法过程进行求解。
第四步便是通过第二步中得到的限制条件(等式或者不等式),对这个模型进行求解。
第五步是回答开始在第一步中提出的问题。至此,数学建模的五步方法就结束了。对上述五步方法进行归纳总结,可得到如下表格:
第一步,提出问题
a)列出问题中涉及到的变量,包括适当的单位
b)注意不要混淆了变量和常量
c)列出对变量所做的全部假设,包括等式和不等式
d)检查单位从而保证假设是有意义的
e)用准确的数学表达式给出问题的目标
第二步,选择建模方法
a)选择解决问题的一个一般的求解方法
b)一般地,这一步需要有一定的数学建模经验和技巧。同时需要熟悉相关的文献
第三步,推导模型的公式
a)将第一步中得到的问题重新表达成第二步选定的建模方法所需要的形式
b)确保第一步中的变量名与第二步的一致
c)记下任何补充假设,这些假设是为了使第一步中描述的问题与第二步中选定的数学结构相适应而做出的
第四步,求解模型
a)将第二步中所选方法应用于第三步得到的表达式
b)注意数学推导,确保推导过程无误且结果有意义
c)采用适当的方法扩大解决问题的范围并减少计算错误
第五步,回答问题
a)用非技术性的语言将第四步的结果重新表述
b)避免数学符号和术语
---------------------
作者:BohouZhang
来源:CSDN
原文:https://blog.csdn.net/qq_27123591/article/details/82223552
版权声明:本文为博主原创文章,转载请附上博文链接!
1 序
感到要在全国赛中取得好成绩经验第一,运气第二,实力第三,这种说法是功利了点,但是在现在中国这种科研浮躁的大环境中要在全国赛中取得好成绩经验是首要的。这并不说明美赛中经验不重要,在美赛中经验也是首位的,但是较之全国赛就差的远多了,这是由于两种比赛的不同性质造成的。
全国赛注重“稳”,与参考答案越接近,文章通顺就可以有好成绩了,美赛则注重“活”,只要有道理,有思想就会有不错的成绩,这个也体现了两个国家的教育现状,这个就不扯开去了。在数模竞赛中经验会告诉我们该怎么选题,怎么安排时间,怎么控制进度,知道什么是最重要的,该怎么写论文......,或许有人会认为选题也需要经验吗?经过参加了多次比赛后觉的是有技巧的,选个好题成功的机会就大的多,选题不能一味的根据自己的兴趣或能力去选,还要和全体参赛队互动下(这个开玩笑了,不大容易做到,只能是在极小的范围内做到),分析下选这个题的利弊后决定选哪个题,这里面道道也不少,后面会详细的展开谈谈。
写这个东西当做是回忆下以前的点点滴滴,希望自己的经验能帮助一些新手(这样的说法不大好,暂时想不出更好的,凑活着先用着)能尽快的成长,尽快的发挥自己的能力,体验数学在应用中的作用,爱上数学,甚至和数学打一辈子交道。国防科大数学建模网的路过(向为)前辈曾经写过个新手教程,写的十分的好,希望写的这个能延续他写的那个教程,能给大家哪怕一点点的帮助。
2 组队和分工
数学建模竞赛是三个人的活动,参加竞赛首要是要组队,而怎么样组队是有讲究的。此外,还需要分工等等一般的组队情况是和同学组队,很多情况是三个人都是同一系,同一专业以及一个班的,这样的组队是不合理的。让三人一组参赛一是为了培养合作精神,其实更为重要的原因是这项工作需要多人合作,因为人不是万能的,掌握知识不是全面的,当然不排除有这样的牛人存在,事实上也是存在的,什么都会,竞赛可以一个人独立搞定。但既然允许三个人组队,有人帮忙总是好的,至少不会太累。而三个人同系同专业甚至同班的话大家的专业知识一样,如果碰上专业知识以外的背景那会比较麻烦的。
所以如果是不同专业组队则有利的多。众所周知,数学建模特别需要数学和计算机的能力,所以在组队的时候需要优先考虑队中有这方面才能的人,根据现在的大学专业培养信息与计算科学,应用数学专业的较为有利,尤其是信息与计算科学可以说是数学和计算机专业的结合,两方面都有兼顾,虽然说这个专业的出路不是很好,数学和计算机都涉及点但是都没有真正的学通这两门专业的,但对于弄数学建模来说是再合适不过了。应用数学则偏重于数,但是一般来讲玩计算机的时间不会太少,尤其是在科学计算和程序设计都会设计到比较多,又有深厚的数学功底,也是很不错的选择。
有不少的人会认为第一人选是数学方面的那第二人选就应该考虑计算机了,因为学计算机的会程序,其实这个概念可以说是对也可以说是不对的。之所以需要计算机方面的人是为了弥补数学方面的人在算法实践方面的不足,但是不是所有的计算机方面专业人都擅长算法实践的,如果要选的话就选擅长算法分析实践的,因为学计算机的不一定会程序,并且会程序的不一定会算法。拿出一个算法,让学计算机的编写程序实践不一定能行,不是小看计算机的,但是这种情况还是比较多的,不然可以看到参加ACM的数学系的居多,比学计算机的搞的好。因此一定要弄清这个概念,不是计算机的就适合的。
所以在组队中有两种人是必需的,一个是对建模很熟悉的,对各类算法理论熟悉,在了解背景后对此背景下的各类问题能建立模型,设计求解算法。一个是能将算法编制程序予以实现,求得解。当然有可能是一个人就将这两种都具备了,这样的话再找个任意具备上述两种能力的人就可以了,以减轻工作量,不然非累死不可。第三个就是专门需要写作的拉,从专业角度看是需要别的专业,比较适合的有生物、土木、机电、电信或机械等专业。在数学建模中各种背景的问题都会出现,所以有其他专业同学的话可以弥补专业知识方面的不足。
综上所述,组队要根据分工而来的,三个人要具备一个数学功底深厚,理论扎实,一个擅长算法实践,另一个是写作(弥补专业知识不足),如果一个组能有这样的人员配置是比较合理的。但是往往事事不能如意,所以不能满足这种人员配置的时候就尽量往这样人员配置靠。
3 培 训
很多刚接触数模的朋友都会碰到一个问题,那就是什么都不会做,看着题目不知道咱们下手,干着急,然后,一旦经过指导之后就知道该怎么做了,同时在做的过程中会碰到各种各样的问题,发现不是算法不了解就是软件不会使用。假使一个题目会做了,但是如果碰到另一个题目又不会了,又不知道该怎么办了。如何使新手尽快的成长是个大家很关心的问题,讨论的也很广泛。各个学校都又不同的方法,有的是开数学建模培训班,有的是以题带连,有的是通过协会普及教育...,各个学校都已形成自己的风格和方法。纵观这些方法,个人感觉有很多不是太科学的地方,有的学校投入很多但是出不了成绩,这时就需要调整下培训方法了。
检验数模学的成果如何是每年的全国赛和美国赛,形式都一样是以通讯的方式完成给定的选题。而做课题的一般进程就是建模型,解模型,写论文这三步。所以从这三个方面去培训是最有效的,因此个人认为最有效提高自己的水平就是以题带练,在实践中提高自己。
1. 建模型:
建模型是最为关键的一步,新手往往是无从下手,这是因为知识面不光,缺乏背景知识,
背景知识对建模型来讲是很重要的,如果课题的背景刚好是本专业的,那就会知道问题的关键是什么,该怎么样去解决,而事实上往往不是这样,问题的背景是所不熟悉的领域,这个时候就需要查资料了解这个问题的背景和了解问题的发展,特点,关键所在以及前人是怎么解决的等等。因此需要训练查找资料和查找文献的能力。新手在知道该怎么做以后碰到的问题就是不会做,这个就是相关知识的缺乏了。
比如需要做聚类分析,需要用遗传算法,需要做相关性分析等等的时候不知道该怎么做?这个就是相关知识的缺乏,当然知道了解掌握全部的算法和知识是不现实的,但是常用的算法和知识是必备的,也是必须的,数模论坛的ducy前辈(董乘宇)曾总结过数模竞赛应当掌握的十类算法(具体可去数模论坛查找):蒙特卡罗算法,数据拟合、参数估计、插值等数据处理算法,线性规划、整数规划、多元规划、二次规划等规划类算法,图论算法,动态规划、回溯搜索、分支定界等计算机算法,最优化理论的三大经典算法:模拟退火算法、神经网络算法、遗传算法,网格算法和穷举法,一些连续数据离散化方法,数值分析算法,图像处理算法。基本上涵盖了数模中几乎所有的算法了,如果掌握了这些对于运筹优化类的问题就可以轻松解决了,但是随着近些年的发展看概率统计的手段在数模中的作用越来越大,所以除了上述十大算法之外还应当对统计方法有相当的了解和掌握。
先前说过,要掌握所有的知识是不现实的,参加数模的其中一个能力就是现学现卖的能力,在最短的时间内掌握知识并将其应用,这个也是吸引很多同学为之着迷的原因,但这并不是说可以不去了解算法,什么都可以到竞赛的时候去学,那个时候就来不及了,因为只有了解的多,知识面宽广了,遇到问题时就知道该怎么办了,然后具体去解决问题。所以增广知识面,博览全书很重要。
2. 解模型:
模型建好了,该怎么解是个常常令人头痛的问题,这个不仅时新手,而且一般是令绝大多数同学头痛的问题,辛辛苦苦把模型建了,但是解不出结果来,这个时候往往时间很紧了,常常另人无奈,所以培训的时候多做这些方面的训练是十分必要的。解模型实质上就是算法的实践。一般来讲是用matlab,mathematica,lingo,lindo,spss等等数学软件来求解,当然有的时候c/c++是很实用的工具。在这里推荐几本数学软件的书《精通matlab6.5》(北航张志涌所著)、飞思工作室出的那套matlab6.5的书、《数学运算大师mathematica4》、万保成老师所写的电子版的《lingo8 for windows》、《最优化模型与实验》,这几本书都是很好的,对掌握这些数学软件是十分合适的。而有些算法数学软件往往无能为力,需要用c/c++来编制程序来解决,对于c/c++个人掌握程度不同,不过如果多看些算法方面的书,多做些ACM类的练习是十分必要的。
3. 写论文:
论文是很关键的一步,写到这里已经写了很多“关键”的词了,事实也如此,步步关键,
其中一步做的不好都对结果有很大的影响,论文是所有工作的体现,如果论文写的不好就功亏于溃,在这里就吃过很大的亏的。因此多写写多练练绝对是有好处的,并且不是写完就算了,要不断的修改,修改到自己非常满意,修改到象所发表在数学期刊中的论文那样才可以。
综上可得,最快最有效的提高水平的方法就是通过做题来发现自己的不足,通过学习弥补自己的不足,这样就查漏补缺,提高了自己的水平了,并且最大程度上取得了经验。
4 选 题
在序中提到过如何选题,现在就具体展开讲讲。
全国赛分为本科组和大专组,每组A,B两题,A为连续的,B为离散的。就我来讲只有运筹优化和非运筹优化两类,运筹优化的题目只要题意理解正确,模型正确,能正常求解,有参考答案,只要解在参考答案附近那基本就能得奖了。而对于非运筹优化类则要麻烦的多了,各式各样的问题都有,并且好些非常不好入手,并且一般来讲没有参考答案,只要有思想有方法就会得到好的结果。
所以一般来讲做优化问题简单的时候,做优化的比做非优化的人数要多。但是涉及到比较复杂的时候那就要颠倒下了。就得奖人数来说A,B两题的各级得奖人数是相仿的,这时如果做A的人数少则得奖率就高了多了,所以在选题人数比较悬殊的时候则要选选做的人数相对少的那个题做,而当选题人数比较平均的时候,就选自己拿手的做了。当然要知道这个选题比例那是不可能的,所以要实现小范围的互动了,由于一开始是赛区内评价所以在小范围内互动是有必要的,在自己的学校内尽量做到平均,不然就是自相惨杀了。
美国赛则为MCM和ICM两种,MCM为A,B两题,ICM为C题。每年参加美赛的对数都在逐步增长,增长的速度还相当的快。获奖比率却年年在变化,但是从总体上看ICM的获奖率则比MCM要高出不少,所以一般来讲,选C题获奖几率则比A,B两题要高出50%了。
这样讲功利了,不过既然是去参加比赛,则就是要去拿奖了,不是讲风格讲什么的时候了。刺到见红,见真章的时候了。并且这样也是符合优化原理的,成功率最优化嘛,呵呵。
但要注意的是所选的题一定要能保证做的出来,不然连个成功参赛奖都很难保证。
还有需要注意的是看起来入手容易的不一定好做,一般到一定地方后很难深入,运筹优化的很大一部分属于这类。而看起来无从下手的题目一旦找到突破口后那就是世外桃源了,就有很多东西可做。所以选题的时候一定要慎重,先把题目的意思搞懂搞透,然后根据自己的优势和能力在互动的情况下选择一个最有利于自己得奖的题做。
5 文献资料查找
在数学建模中文献资料的查找是十分关键,其实不仅是在数学建模中,在学习和做研究就是如此,不阅读文献资料就相当于闭门造车,什么都弄不出来,现在的工作几乎都可以说是站在前人的肩膀上,从出生开始就是站在前人的肩膀上了,所学的任何书本知识都是前人总结出来的。
通过文献资料的阅读可以知道别人在这个方面做了多少工作了,怎么做的工作,取得了哪些进展,还存在什么问题没解决,难点在哪里,热点在哪里,哪里是关键,哪些是有价值的,哪些是无意义的等等等等......,并且可以通过查找文献得到一些很有用的信息,比如某个教授的牛的程度,所擅长的领域等等,呵呵,翻教授老底了,比较好玩,选导师的时候强烈推荐。
文献查找主要有三个模式:
A. 书
B. 书+中外文期刊数据库
C. 书+中外文期刊数据库+学位论文
D. 书+中外文期刊数据库+学位论文+搜索引擎
对于全国赛推荐D模式,但要改为Dc模式:中外文期刊数据库+学位论文
对于美赛则要改为Da模式:外文期刊数据库+搜索引擎。
在此要解释下为何如此推荐,对于参加建模的来说一般书基本上是用不上了的,没必要去查了,直接查找数据库即可了,全国赛的题目大多是研究了很多年的东西了,这个也是和国内学术环境相关的,虽然近几年的赛题是体现最新形式的,但是相关的研究还是有的,还是可以参考的,要知道国内鲜有几个教授牛的站在国际前沿还给本科生出个数模题玩玩的,一般都是老东西新面孔的。也就是可以归类为学术研究类的新面孔老方法类。所以查数据库是最有效率的方法,并且查学位论文是尤其推荐的,要知道查找学位论文是最高效率得到信息的途径。
虽然学位论文很长,很吓人,没有七八十页也有个一百多页,其实看多了学位论文就知道真正有用的东西页就那么个十多页最多二十多页,直接翻到那个部分看就可以了,为什么篇幅这么大就和中国的教育中的一些硬性指标相关了,每个级别的学位论文都有一个规定的字数范围,虽然大部分是垃圾。
美赛则有语言障碍,要在有限时间内完成课题研究和论文写作,则需直接查找外文文献了,要知道中国目前的总体科学水平和国外的差距是至少5年的,这个是保守估计,实际可能是2倍以上。所以一般国外的当前研究国内鲜有涉及,当国外搞的很成熟了,产业化了,咱们国内就有教授引进了,开始研究了,吃点人家的残羹冷炙,这样说是刻薄了点,但这种情况真的不少见。这个就是中文数据库在美赛中无用的原因了。
此外在美赛中用搜索引擎的实际效果好的往往出人意料,基本可以这么说,用搜索引擎比数据库来的更好,介绍一个n多人知道的技巧,怕还有人不知道就在此罗嗦下:搜索引擎用google足以,点击高级搜索,然后输入需要的key words,在格式中选pdf格式。很简单吧,但很实用,填句弱智的话,报选择中文搜索啊,碰到过一次朋友如此搜索的,当时巨汗!很多参加数模的同学对pdf格式了解很少,实在不应该吧,在下估计这帮人都是学习成绩好的不得了的,没怎么用过计算机和没怎么上网,并且是word的忠实铁杆用户。
pdf格式就是一种国外通用的标准便携电子文档格式,要知道外国人几乎不用ms word的,微软发财中国人民的贡献巨大啊(虽然盗版盛行)。顺便介绍下国内外主要数据库的文献格式:pdg是超星格式,caj和caa为清华同方数据库(cnki)(它有三个名头,中国学术期刊网什么什么的NB名字也是指它),vip为维普,最重头的就是pdf,都需要不同的阅读器才能打开,还好都是免费的。
在查找文献中很重要的一点是查找到的文献有效率,因为很多文献找到是没有用的,能有个3-4个有用的文献是很难得了的,通过数据库关键词查找到的文献的有效率是很低的,而通过查找已查找到的文献的参考文献是很有效的一种手段,其有效率则大大的提高了,通过这种连锁查找是强烈推荐的,尤其在美国赛中超级强烈推荐。
列下中外文数据库:
中文:CNKI、VIP、万方
外文:EBSCO、Elserive、ProQuest、Springerlink、EI、ISI Web of Knowledge
再列个电子图书站点,以备不时之需,中国数字图书馆,书生之家,超星数字图书馆
有个情况就是好些学校不一定这些数据库都买了,这样就需要违点法了,搞破解。这些技术很复杂,在此不展开了。找代理啊,破解超星阅读器啊,下载书生的书,搜索CNKI,VIP,
万方的帐户和密码,这些技术很有意思,很有挑战性和成就感,这也就是黑客盛行的原因吧。
说了这么多,综述下吧,查找文献是决定参赛论文起点高低的关键。三天中做的课题很少是重新起灶的,一般都是在文献的基础上做的,所以找到的文献如果离所做的课题越近则参赛成绩会好。所以在查找文献多下点功夫不会错的,砍柴不误磨柴功:
6 论文写作
论文是建模中最后的一环也是最关键的一环,这环做好了那就圆满了,做砸了全功尽弃
了。关于怎么写论文已经有很多文章介绍了,这就足以可见写论文的重要性了。先介绍下写论文的工具,或许很多朋友要纳闷了,写论文什么工具,不就是电脑呗,还有朋友会进一步说用word呗,两者都对,当然用电脑的这个说法绝对正确,如果说是用手那更对了,呵呵,其实指的工具是软件。很多人用word,对于word就不重点介绍了,要重点介绍的是tex,它是一个功能强大的特别适合排版科技文献和书籍的格式化排版程序。它是由著名计算机专家和数学家斯坦福大学D.E.Knuth教授研制的。
20世纪60年代,knuth准备出系列专著《计算机程序设计技巧》(The Arts of Computer Programming),前三册已经出版,当他正在撰写第四册时,出版社拿来第二册的第二版给他过目,结果令他大失所望,因为当时出版社的印刷技术没有使他的书稿更好看,反而变糟了,尤其是在数学公式和字体上面的缺陷更令他无法接受。于是他就打算自己写一个既能供科学家编排手稿又符合出版社印刷要求的高质量的计算机排版系统。这就是TeX排版系统的由来。
TeX系统是由Pascal语言编写的,程序的源代码也是公开的。它包含300条基本命令和600条扩展命令,几乎可以排版任何格式的文献,如一般文章、报告、书刊和诗集等,对数学公式的排版也被公认是最好的。TeX系统的优点之一是它还支持命令宏,这使得使用TeX成为一种乐趣,用户可以自己编写红包来定义更多、更方便的新命令,这也是TeX能得以迅速发展的原因。而且TeX是一个可移植性系统,可以运行于所有类型的计算机(如苹果机、IBM、PC机及大型工作站)和各种操作系统(如DOS、Windows、Unix等),它的排版结果dvi文件于输出设备无关,可以在不同的操作系统上显示和打印。TeX源文件是ASCII码文件,可以方便地在网络上传播。目前,大多数学术部分和校园网上都安装有TeX系统。国际上许多出版机构也采用TeX系统来排版书刊,不少出版社还要求作者提供手稿的TeX源文件。
虽然TeX的功能非常强大,用它可以排版任何式样的文稿,但普通用户要灵活掌握TeX的900条初始命令还是有困难的。因而,TeX公开几年后,利用TeX的宏定义功能开发的宏库AMSTeX和LaTeX就产生了。AMSTeX是Michael Spaivak受美国数学会(AMS)的委托编写的,重要用于AMS和其他分支机构出版的大量书籍、期刊和评论。AMSTeX含有一个宏包(Style file),供作者用来方便的准备稿件。用AMSTeX可以方便地排印出非常复杂的数学公式和AMS制定的全部数学符号。
LaTeX是由美国计算机学家Leslie Lamport于1985年开发成功的。尽管在排版数学公式和数学符号方便LaTeX不如AMSTeX,但LaTeX提供了大量易于学习和使用的命令,如非常有用的交叉引用命令(cross-referencing commands),这是AMSTeX所不具备的。因而LaTeX有更广泛的用途,特别是在排版信件、书刊、诗集等方面更优于AMSTeX。TeX的命令好比是建筑所使用的各种各样的材料,优秀的建筑师用它能建造出各种美丽的建筑;LaTeX的命令好比是已经建筑好的各种各样的房间和家具,用户只需选择适合自己的房间和家具就能得到满意的住所,而且这种房间和家具之多几乎无须用户自己动手建造。为了使用户既能使用LaTeX提供的大量命令,又能排版出优美的数学公式和数学符号,美国数学会又开发了AMSTeX。
TeX的使用相对于word要麻烦很多,但是其优势势非常明显的,就举几个吧。word中数学公式是以图片形式保存的,一旦公式和图片多的话则很容易死机,在竞赛中则吃过大亏,在全国赛和国际赛中都发生过这些情况,辛辛苦苦写了很多,但是全部没了,那时真是欲哭无泪。
现在是学乖了,用word写论文时时常按ctrl+s。并且不同版本不兼容,xp版本到2000版本就出现很严重的不兼容问题。而LaTeX则不会出现这种情况。用word写论文时可以发现当公式或数学符号在某行中时则行距撑的很大了,十分难看,LaTeX则不会出现这种问题。说到公式和数学符号则可很明显的感觉到word和LaTeX 的不同了,爱美之心人皆有之,学数学的很大程度也是因为被数学的美所深深的吸引而迷恋数学。而LaTeX排版出来的数学公式则比word要漂亮的多了。此外在写论文的时候对参考文献十分头痛,而LaTeX则在这个方面不要比word显的太强悍啊。
介绍了这么多LaTeX并不是说明LaTeX比word怎么怎么牛,每个事务存在就有它存在的的价值,word在很多地方有比LaTeX很明显的优势。只不过在数学论文这个方面LaTeX要比word强太多了,故而介绍这么多,推荐使用LaTeX写数学论文。
由于全国赛是要求用word的,所以在全国赛的时候还是乖乖的用word好了,写到这忍不住想骂街了,数学建模全国赛竟然要求用word写,什么他妈的规矩,理工科现在都主流用LaTeX了,并且国外都普遍用TeX,word不被接受,在这么高规格的比赛中要用word,没天理啊,希望哪天那帮大爷教授们能开窍了,能接受LaTeX写的PP论文,能提供LaTeX的模板。在美国赛中则尽量用LaTeX写,优势太明显了,虽然在上次美赛中没用,不过如果再参加一次的话坚决用LaTeX编写。宣传完LaTeX了,开始介绍写论文的技巧。
在什么论文中摘要都是十分重要的,尤其是在全国赛和美国赛中摘要的地位很显赫的,两个组委会都提出了摘要的重要性,再三明文提醒参赛者要注重摘要。要知道,无论全国赛和美国赛第一轮都是看摘要筛选。在全国赛中或许还能看看,但在美国赛中只要第一轮通过摘要的筛选就可以获二等奖了。
在摘要的写作中一定要花3个小时以上,反复修改,一定要修改修改再修改,修改个10几稿才能过关。在摘要中一定要突出方法,算法,结论,创新点,特色,不要有废话,一定要突出重点,让人一看就知道这篇论文是关于什么的,做了什么工作,用的什么方法,得到了什么效果,有什么创新和特色。一定要精悍,字字珠玑,闪闪发光,一看就被吸引。这样的摘要才是成功的。
论文的主题部分也要修改修改再修改,当然主体部分的要求没有象摘要这么要求高了,但绝对不能马虎,用电脑的都知道,很容易打错别字,这个都是QQ或MSN 惹的“祸”,有的时候为了图方便在不影响理解的情况下别字满天飞,所以难免在写论文的时候不自觉的打错别字。所以首要是找错别字,第二就是要修改语句,理工科的学生在文学上的造诣都是有数的,大学后没有文学课,也不看文学刊物,有的读理工科还就是为了避开语文课,写出来的东西干巴巴的,除了名词和动词就没有什么了,难得见个形容词。因而修改语句很关键,一定要通顺,文采什么的到不要紧。此外逻辑一定要清楚,如果逻辑混乱那就出丑大了。在写论文当中一定要体现数学功底,要写的符合数学习惯。评论文的几乎都是数学工作者,绝大部分是教授,有没有数学功底一眼就撇的出来,其实这个我们也一样,经过二年数学训练后的学生写出来的
西多多少少都带有数学系出来的印记。顺带提下,编程最要用matlab,因为评委们普遍喜欢用matlab写的程序,虽然他们不看,就算看也看不懂,但是尽量迎合他们总不会错的。再者,用matlab写数学程序一般是数模的首选,最爱。在写论文的时候总要参考文献的,所以文献一定要整理好,并率先在参考文献中排好次
序,以免混乱,一旦乱了,那个麻烦大了,很痛苦的。并且在引用他人的地方一定要注明,这个是最起码的诚信问题了,引用他人多少东西不要紧,不要以为这个是抄袭,只要注明了就不是抄袭,当然不能整篇引用了,那样的话就真的是抄袭了,呵呵。
在论文写作中一定要注意能用图表的地方尽量用图表来表示,图表比用文字阐述要来的清楚直接。一张图表往往能代替一大段干巴巴文字。并且图文并茂多爽啊,要知道教授们大都年纪不小了,为了教授们的眼睛,减轻他们受文字的折磨多用图表绝对是不二的选择。同时这也是偷懒和使论文增色的不二选择。
须注意的是图表的引用要规范,在交叉引用的时候一定要小心,不然会对不上就麻烦了。如果用word写,则强烈推荐看候捷大牛写的《word排版艺术》,对于这本书不详细介绍了,搜索下就出来了,是本不错的东西,牛人的作品啊,的美赛论文就用它给搞定的,很不错。
再附上个用Word编辑论文的几个建议(作者不详):
由于各方面的原因,大家主要还是用Microsoft Word (以下简称Word)编辑论文。Word在写科技论文方面虽然有一些先天不足,但却提供了非常强大的功能。如果不能充分利用这些功能,可能经常要为不断地调整格式而烦恼。我把自己以前使用Word的经验和教训总结一下,抛块砖。
原则: 内容与表现分离
一篇论文应该包括两个层次的含义:内容与表现,前者是指文章作者用来表达自己思想
的文字、图片、表格、公式及整个文章的章节段落结构等,而后者则是指论文页面大小、边距、各种字体、字号等。相同的内容可以有不同的表现,例如一篇文章在不同的出版社出版会有不同的表现;而不同的内容可以使用相同的表现,例如一个期刊上发表的所有文章的表现都是相同的。这两者的关系不言自明。在排版软件普及之前,作者只需关心文章的内容,文章表现则由出版社的排版工人完成,当然他们之间会有一定交互。Word 倡导一种所见即所得(WYSIWYG)的方式,将编辑和排版集成在一起,使得作者在处理内容的同时就可以设置并
立即看到其表现。可惜的是很多作者滥用WYSIWYG,将内容与表现混杂在一起,花费了大量的时间在人工排版上,然而效率和效果都很差。
本文所强调的“内容与表现分离”的原则就是说文章作者只要关心文章的内容,所有与内容无关的排版工作都交给Word 去完成,作者只需将自己的排版意图以适当的方式告诉Word。因为Word不仅仅是一个编辑器,还是一个排版软件,不要只拿它当记事本或写字板用。主要建议如下。
1. 一定要使用样式,除了Word原先所提供的标题、正文等样式外,还可以自定义样式。
如果你发现自己是用选中文字然后用格式栏来设定格式的,一定要注意,想想其他地方是否需要相同的格式,如果是的话,最好就定义一个样式。对于相同排版表现的内容一定要坚持使用统一的样式。这样做能大大减少工作量和出错机会,如果要对排版格式(文档表现)做调整,只需一次性修改相关样式即可。使用样式的另一个好处是可以由Word 自动生成各种目录和索引。
2. 一定不要自己敲编号,一定要使用交叉引用。如果你发现自己打了编号,一定要小心,这极可能给你文章的修改带来无穷的后患。标题的编号可以通过设置标题样式来实现,表格和图形的编号通过设置题注的编号来完成。在写“参见第x章、如图x所示”等字样时,不要自己敲编号,应使用交叉引用。这样做以后,当插入或删除新的内容时,所有的编号和引用都将自动更新,无需人力维护。并且可以自动生成图、表目录。公式的编号虽然也可以通过题注来完成,但我另有建议,见5。
3. 一定不要自己敲空格来达到对齐的目的。只有英文单词间才会有空格,中文文档没有空格。所有的对齐都应该利用标尺、制表位、对齐方式和段落的缩进等来进行。如果发现自己打了空格,一定要谨慎,想想是否可以通过其他方法来避免。同理,一定不要敲回车来调整段落的间距。
绘图。
统计图建议使用Execel生成,框图和流程图建议使用Visio画。如果不能忍受Visio对象复制到Word的速度,还可以试试SmardDraw,功能不比Visio弱,使用不比Visio难,速度却快多了。如果使用Word的绘图工具绘图,最好以插入Word图片的方式,并适当使用组合。
5. 编辑数学公式建议使用MathType5.0,其实Word集成的公式编辑器是它的3.0版。安装MathType后,Word会增加一个菜单项,其功能一目了然。一定要使用MathType 的自动编号和引用功能。这样首先可以有一个良好的对齐,还可以自动更新编号。Word 正文中插入公式的一个常见问题是把上下行距都撑大了,很不美观,这部分可以通过固定行距来修正。
参考文献的编辑和管理。如果你在写论文时才想到要整理参考文献,已经太迟了,但总比论文写到参考文献那一页时才去整理要好。应该养成看文章的同时就整理参考文献的习惯。手工整理参考文献是很痛苦的,而且很容易出错。Word没有提供管理参考文献的功能,用插入尾注的方法也很不地道。我建议使用Reference Manager,它与Word集成得非常好,提供即写即引用(Cite while you write,简称Cwyw)的功能。
你所做的只是像填表格一样地输入相关信息,如篇名、作者、年份等在文章中需要引用文献的的方插入标记,它会为你生成非常美观和专业的参考文献列表,并且对参考文献的引用编号也是自动生成和更新的。这除了可以保持格式上的一致、规范,减少出错机会外,更可以避免正文中对参考文献的引用和参考文献列表之间的不匹配。并且从长远来说,本次输入的参考文献信息可以在今后重复利用,从而一劳永逸。
类似软件还有Endnote和Bi blioscape。Endnote优点在于可以将文献列表导出到BibTeX格式,但功能没有Reference Manager强大。可惜这两个软件都不支持中文,据说Biblioscape对中文支持的很好,我没有用过,就不加评论了。
7.使用节。如果希望在一片文档里得到不同的页眉、页脚、页码格式,可以插入分节符,
并设置当前节的格式与上一节不同。
上述7点都是关于排版的建议,还是要强调一遍,作者关心的重点是文章的内容,文章的表现就交给Word去处理。如果你发现自己正在做与文章内容无关的繁琐的排版工作,一定要停下来学一下Word的帮助,因为Word 早已提供了足够强大的功能。
我不怀疑Word的功能,但不相信其可靠性和稳定性,经常遇到“所想非所见”、“所见非所得”的情况让人非常郁闷。如果养成良好的习惯,这些情况也可以尽量避免,即使遇上,也可以将损失降低到最低限度。建议如下:
8. 使用子文档。学位论文至少要几十页,且包括大量的图片、公式、表格,比较庞大。如果所有的内容都保存在一个文件里,打开、保存、关闭都需要很长的时间,且不保险。建议论文的每一章保存到一个子文档,而在主控文档中设置样式。这样每个文件小了,编辑速度快,而且就算文档损坏,也只有一章的损失,不至于全军覆灭。建议先建主控文档,从主控文档中创建子文档,个人感觉比先写子文档再插入到主控文档要好。
9.及时保存,设置自动保存,还有一有空就ctrl+s。
10. 多做备份,不但Word不可靠,windows也不可靠,每天的工作都要有备份才好。注意分清版本,不要搞混了。Word提供了版本管理的功能,将一个文档的各个版本保存到一个文件里,并提供比较合并等功能。不过保存几个版本后文件就大得不得了,而且一个文件损坏后所有的版本都没了,个人感觉不实用。还是多处备份吧
11.插入的图片、和公式最好单独保存到文件里另做备份。否则,哪天打文档时发现自己辛辛苦苦的编辑的图片和公式都变成了大红叉,哭都来不及了。
其他建议:
12. 使用大纲视图写文章的提纲,调整章节顺序比较方便
13. 使用文档结构图让你方便的定位章节
14. 使用文档保护,方便文章的审阅和修改
15. Word表格的排序、公式和转换的功能也是很值得学习的
上面的建议并不全面,但相信比较管用。如果还有疑问,自己花些时间研究一下Word的帮助,相信会有事半功倍的效果。
7 实 战
这个是最后一篇了,完结篇,就谈谈在全国赛具体三天和美国赛具体四天该怎么做。就以时间为序详细展开讲讲。全国赛是上午8:30分开始,美国赛是9点整开始,比全国赛多了一天,这个是十分有利的。三天太少,五天太多,四天刚好。但是全国赛就三天那就只能在三天中完成,时间是比较紧的。
在上午8:30分拿到题目以后,就要潜心研究题目,吃透研究透题目。在中午的时候确定做哪个题目,然后就要开始查找文献资料。确定做哪个题最迟不能拖到晚上8:30分,也就是说一定要在拿到题目后12个小时内确定选题。查找资料的工作则要在第二天的上午10整前结束了,第一天就这么过,并要适当休息下,保证以后几天的精力。当然如果体力充沛的话可以不用睡觉,本人在两次全国赛中80个小时最多休息了4个小时,在浙大有个记录是连续5天不睡觉的,这个记录是不敢破,毕竟没那么好的体力。在第一天的时候理解题意是最关键的,并且一定要理解透彻,并且理解的越快越好。
第二天中午开始则要开始动笔写论文了,一边分析问题一边写论文。如果到题目做完了再写则来不及了。在下午的时候则要把模型构建好了,并开始求解,到第三天中午的时候则要基本完成模型的求解了。到第三天晚上则要基本完成论文了。并要不断的修改论文,开始最后最关键的一环,艰苦卓越的修改修改再修改的过程。这个时间安排是最理想的,能达到如此的队一般都能取得较好的成绩,但是很多队大都是前松后紧,我们队也是,慢热。结果往往时间不够,最后的环节没做好导致前功尽弃。这个教训很是深刻啊。在建模中往往会出现有分歧的时候,我和我的队友在建模中则经常出现,难得有一致的意见。
但是我们正是在这种分歧中对题目了解的更透彻,对细节搞的更清楚。我专职数学我的队友专职计算机,因此在考虑问题的时候从数学角度出发,我的队友从计算机程序算法角度出发,着重复杂性研究,不发生分歧才怪,经常争的面红耳赤,就差动手了。虽然如此,但丝毫不损伤个人感情。
在这个时候则要耐着性子坐下来好好分析问题,将我们的分歧展开谈,将各自方法的优点结合,扬长避短,做的尽可能的好。而当实在不能融合的时候则一定要有一个让一步,先将题目做下去,不能僵在那里,让时间白白流逝。在做下去的过程中会发现问题再进行弥补的。在三天的工作中团结就是力量,一定不能发生内讧。不能有个人英雄主义的行为出现,并且一定不能精神疲惫,一定要有激情有信心。
在三天工作中休息时间要安排好,由于时间有限,不能象往常那样作息了,睡的多就意味着工作时间减少,当然有正常作息拿一等奖的例子,不过那是少数,所以怎么样安排休息是有讲究的。一般来讲要当困的时候才去休息,这样的休息才是最高效的,可以一占枕头就着,并且睡4个小时起床立马神采奕奕,全部恢复。第一天一定要安排休息时间,在第三天一般是没的休息的,鲜有几个队在第三天的时候能睡的着的。三个人一定要轮换休息,也就是说一定要保证一人以上不睡觉,不能三人都去睡觉。第一天的时候勉强可以,但不推荐。
在工作中,常常有一些想法出来,无论这些想法是可行的还是荒诞的,都要记下来。因为那或许就是问题的解决之法,或许就是闪光点。无论是来得及做的和来不及做的都记下,来不及做的可在论文的发展或优缺点中给予体现。这些就是闪光的地方。在工作中一定要有重点,分先后。先做主干,再补充枝干,有层次的做。
在碰到困难的时候一定要镇定,不能惶急。不要逃避要用于面对,一定能解决的。很多困难无非就是建模和解模的困难。建模中碰到困难则不妨换个思路,跳出局部从全局看,换个角度等等。在解模中碰到困难则要进行估值,降低求解范围和难度,但是一定要注意的是绝对不要伪造数据,因为这样一则有为诚信二则很容易在答案上误差较大直接出局。在无法求解的情况下不妨求助于图表,让可视化来代替,当然还有很多方法可以解决,总之一定要诚信第一,要有信心和恒心。
在写论文的时候一定要注意经常保存备份。
---------------------
作者:毅飞冲天@
来源:CSDN
原文:https://blog.csdn.net/Hello_leiyuanyi/article/details/81236633
版权声明:本文为博主原创文章,转载请附上博文链接!
前言:看完数学建模的统计回归模型,更是感到了数学建模的“细腻”之处,对比与机器学习,如果说机器学习像是“打一场仗”,那数学建模更是像“做一场手术”,一个简单的回归问题也可以从中感觉到他“细腻”的美感
回归模型是利用统计分析方法建立的最常用的一个模型,下面将通过对软件得到的结果进行分析,进而改进我们的模型。
下面将用3个例子展示对回归模型的优化。
1.牙膏的销售模型
问题的提出:假设一个公司需要预测不同价格和广告费用下的牙膏的销售量,我们需要怎么建立模型呢?
假设我们拿到的数据如下:
我们可以根据数据建立一个基本的模型:
y:公司牙膏销售量y:公司牙膏销售量
x1:价格差x1:价格差
x2:公司广告的费用x2:公司广告的费用
模型为:y=β0+β1x1+β2x2+β3x22+ϵy=β0+β1x1+β2x2+β3x22+ϵ
求解这个模型我们会得到下面的结果:
这说明y的90.54%可以由模型确定,x2对因变量y 的影响不太显著(因为β2的置信区间包括0点β2的置信区间包括0点)。
这些数据具体到公司的销售量到底意味着什么呢?
假设我们把控制价格差x1=0.2x1=0.2,投入广告费x2=650x2=650万,根据我们的模型可以求出y的值为8.2933(百万支),销售量的预测区间为[7.8230,8.7636]。
那么我们就有95%把握知道销售量在7.8320百万支以上。
优化——加入交互项
刚才我们只考虑了每个因素单独的影响,现在我们考虑他们的影响有交互作用,即我们的模型变为:
y=β0+β1x1+β2x2+β3x22+β4x1x2+ϵy=β0+β1x1+β2x2+β3x22+β4x1x2+ϵ
从而求得的结果为:
这是后仍控制价格差x1为0.2,投入广告费用x2位6.5百万,我们得到的销售量为8.3272,可见比原来有所增加,预测区间变为[7.8953,8.7592],预测区间缩短。
下面是模型的比较:
那么加入交互项对模型有什么影响呢?
由上图可见加入交互项之后函数的变化更加明显,我们也可以从中得到一些启发,比如下图我们用了不同的价格差,对广告费(x2x2)用和销售量(y)进行比较:
由上图我们可以容易的总结出以下两条:
广告费用小于7左右的时候,价格优势的作用更加明显,价格低的销售量多。
当广告费大于6百万的时候,价格差小的,销售良随着广告的增加而增加的速率更快,所以此时应该增加广告来吸引眼球。
2.软件开发人员的薪金
建立模型研究薪金与资历、管理责任、教育程度的关系,从而分析人事策略的合理性,作为新聘用人员薪金的参考
数据为46个开发人员的薪资
资历~ 从事专业工作的年数;管理~ 1=管理人员,0=非管理人员;教育~ 1=中学,2=大学,3=更高程度
建立基本模型
y 薪金,x1 资历(年)y 薪金,x1 资历(年)
x2=1 管理人员,x2=0 非管理人员x2=1 管理人员,x2=0 非管理人员
x3=1 中学,x3=0 其它x3=1 中学,x3=0 其它
x4=1 大学,x4=0 其它x4=1 大学,x4=0 其它
所以:
中学:x3=1,x4=0;大学:x3=0,x4=1;更高:x3=0,x4=0中学:x3=1,x4=0;大学:x3=0,x4=1;更高:x3=0,x4=0
回归模型为:
y=a0+a1x1+a2x2+a3x3+a4x4+ϵy=a0+a1x1+a2x2+a3x3+a4x4+ϵ
得到结果:
我们可以从得到结果分析:
资历增加1年薪金增长546
管理人员薪金多6883
中学程度薪金比更高的少2994
大学程度薪金比更高的多148
a4置信区间包含零点,解释不可靠!
优化——残差分析
残差:e=y−y^e=y−y^
残差与资历x1的关系
可见残差的波动较大
管理与教育的组合一共有6种:
比较残差和管理——教育组合的关系:
残差全为正,或全为负,管理—教育组合处理不当 ,应在模型中增加管理x2与教育x3, x4的交互项
改进的模型
y=a0+a1x1+a2x2+a3x3+a4x4+a5x2x3+a5x2x4+ϵy=a0+a1x1+a2x2+a3x3+a4x4+a5x2x3+a5x2x4+ϵ
去除异常的值
R,F有改进,所有回归系数置信区间都不含零点,模型完全可用
由此可以定制6种管理—教育组合人员的“基础”薪金(资历为0)
大学程度管理人员比更高程度管理人员的薪金高
大学程度非管理人员比更高程度非管理人员的薪金略低
总结一下
我们利用了残差分析法发现模型的缺陷,并且由前两个我们也可以发现,引入交互项往往能够改进模型
3.投资额与国民生产总值和物价指数
根据对未来国民生产总值(GNP)及物价指数 (PI)的估计,预测未来投资额
该地区连续20年的统计数据
首先建立基本的统计回归模型:
t−年份,yt−投资额,x1t−GNP,x2t−物价指数t−年份,yt−投资额,x1t−GNP,x2t−物价指数
模型为:yt=β0+β1x1t+β2x2t+ϵyt=β0+β1x1t+β2x2t+ϵ
根据数据得到的结果:
此模型不足的地方:
没有考虑时间序列数据的滞后性影响
可能忽视了随机误差存在自相关;如果存在自相关性,用此模型会有不良后果
模型自相关的诊断
定性诊断——残差分析
模型残差:et=yt−y^tet=yt−y^t
et−1et−1表示上一个数据的残差
画出et−et−1et−et−1的散点图
由图可见,大部分点落在1,3象限,说明有正的自相关
所以直观的判断该模型有正的自相关
定量诊断——D-W检验
我们引入自相关回归系数ρρ,当ρ=0ρ=0表示无自相关性,ρ>0ρ>0表示存在正自相关性,ρ<0ρ<0表示存在负自相关性
Q1:如何估计ρρ?
A1:D-W统计量
D-W统计量的计算
由D-W值的大小确定自相关性:
那如何知道dL和dU呢?这是可以查表的。
Q2:如何消除自相关性?
A2:广义分差法
我们通过上面可以求得DW值和dL以及dU,那我们计算ρ=1−DW/2ρ=1−DW/2就可以知道是否存在自相关性了
例如我们样本容量n=20,回归变量数目k=3,a=0.05 ,我们可以查到临界值dL=1.10, dU=1.54
ρ=1−DW/2=0.5623ρ=1−DW/2=0.5623,说明存在正的自相关性。
于是我们就可以得到新的模型:
我们可以根据这个模型我们可以再做一次自相关性的检测,发现新的模型已经没有自相关性了。
最后我们就可以根据新的自相关模型进行对下一年数据的预测了。
总结一下
在面对与时间有关的数据的时候,我们常常要检测模型的自相关性,消除了模型的自相关性之后才能建立更加精确的模型。
常常通过D-W方法检测模型的自相关性,用广义差分法消除模型的自相关性。
浓度等后一个量往往受前一个量的影响,在建立模型时往往要考虑前一个值得影响
---------------------
作者:土豆洋芋山药蛋
来源:CSDN
原文:https://blog.csdn.net/qq_33414271/article/details/79208880
版权声明:本文为博主原创文章,转载请附上博文链接!
类别 |
类别(2) |
模型名称 |
关键点 |
备注 |
参考书目 |
|||||
复杂系统 |
库存模型 |
|
|
|
|
|||||
排队模型 |
|
|
|
|
||||||
可靠系统 |
|
|
|
|
||||||
差分方程模型 |
动力系统类 |
酵母菌增长模型 |
平衡点;平衡点的分类 |
|
|
|||||
地高辛衰减模型 |
|
|
|
|||||||
战争模型 |
总量一定时,对单量的分配 |
|
|
|||||||
|
竞争物种模型
|
不稳定平衡:对初始值敏感 |
|
|
||||||
比例性模型 |
|
钓鱼比赛模型 |
几何相似性 |
|
|
|||||
|
身高、体重与灵活性模型 |
|
|
|
||||||
数据拟合模型 |
最小二乘拟合 |
停止距离模型 |
|
|
97 |
|||||
海湾收成模型 |
|
|
|
|||||||
多项式拟合 |
磁带播放模型 |
高阶多项式敏感度很强 |
光滑化 |
115 |
||||||
停止距离模型(2) |
三阶样条法。有自然和强制样条两种 |
|
134 |
|||||||
预测 |
时间序列 |
GM(1,1),指数平滑,线性平滑 |
|
|
|
|||||
因果分析法 |
|
|
|
|
||||||
聚类分析 |
灰色关联度分析 |
|
|
|
|
|||||
聚类分析 |
|
|
|
|
||||||
因子分析 |
|
|
|
|
||||||
模拟方法 |
蒙特卡罗算法 |
硬币投掷模型 |
|
|
149 |
|||||
汽油储存模型 |
逆线性样条(可改变随机数范围) |
|
155 |
|||||||
港口系统模型 |
改变参数时,改善情况的分析 |
|
164 |
|||||||
离散概率模型 |
马尔可夫链 |
汽车租赁模型 |
|
要结合蒙特卡罗算法 |
176 |
|||||
投票趋势模型 |
|
|
177 |
|||||||
Markov决策 |
|
|
|
|||||||
|
串联和并联系统模型 |
|
|
178 |
||||||
线性规划模型 |
无约束类 |
生产计划模型 |
|
|
192 |
|||||
取整数类 |
载货模型 |
|
|
194 |
||||||
动态规划类 |
|
|
|
197 |
||||||
多目标规划类 |
投资问题 |
有时须对目标进行取舍。可采取加权 |
系统层次分析 |
196 |
||||||
冲突目标 |
|
|
|
|
||||||
Minmax与maxmin |
|
|
|
|
||||||
机会约束 |
|
约束满足概率性>P |
|
|
||||||
矛盾约束 |
|
约束相互矛盾 |
|
|
||||||
单纯形法 |
木匠生产模型 |
注意步骤性。 |
|
215 |
||||||
|
|
|
|
|
||||||
参数模型 |
|
|
|
|
||||||
|
|
多步骤形的规划 |
|
|
||||||
数值搜索法 |
工业流程优化 |
黄金分割搜索法 |
还有二分搜索法 |
233 |
||||||
网络流 |
|
|
|
|
|
|||||
最大流 |
|
|
|
|
||||||
最短路 |
|
关键路线法 |
|
|
||||||
网络计划 |
|
|
|
|
||||||
|
布点问题 |
|
|
|
||||||
|
|
|
|
|
||||||
|
分配问题 |
匈牙利方法 |
|
|
||||||
|
|
|
|
|
||||||
|
|
|
|
|
|
|||||
非线性规划 |
分式规划 |
|
目标是分式 |
|
|
|||||
|
|
|
|
|
||||||
几何规划 |
|
|
|
|
||||||
对策 |
2人0种对策 |
|
|
|
|
|||||
合作 |
|
|
|
|
||||||
量纲分析模型 |
|
单摆模型 |
通过实验选择最终模型 |
|
253 |
|||||
|
爆炸模型 |
|
函数随爆炸威力上升改变 |
258 |
||||||
|
烤火鸡模型 |
|
|
262 |
||||||
|
阻力模型 |
使用相似性、比例性。 |
注意它额外定义的物理量。 |
268 |
||||||
图标模型 |
|
军备竞赛模型 |
|
民防、移动发射台、多弹头 |
271 |
|||||
税收归宿模型 |
税收-能源危机模型 |
参考经济学书籍! |
|
288 |
||||||
税收-汽油短缺模型 |
|
|
|
|||||||
微分方程模型 |
人口模型 |
马尔萨斯人口模型 |
|
无限增长 |
299 |
|||||
有限增长模型 |
|
可推广到其它生物的增长 |
301 |
|||||||
|
用药模型 |
|
|
|
||||||
|
储蓄模型 |
关注Euler法的使用(该法并不精确) |
326 |
|||||||
生物关系模型 |
竞争捕猎模型 |
|
363页:相应的Euler法使用 |
|
||||||
捕食者-食饵模型 Scheafer微分方程模型 |
|
|
|
|||||||
|
Lanchester战斗模型 |
|
|
350 |
||||||
|
SIR模型 |
|
|
|
||||||
|
军备竞赛的经济模型 |
|
|
355 |
||||||
混沌与分形模型 |
|
|
|
|
||||||
连续优化问题 |
Steiner树 |
|
|
|
|
|||||
|
库存模型 |
|
|
|
||||||
|
|
|
|
|
||||||
|
制造模型 |
最陡上升梯度方法 |
|
375 |
||||||
|
石油转运模型 |
Lagrange乘子法 |
注意里面涉及到的经济学概念和意义 |
381 |
||||||
|
航天飞机的水箱模型 |
|
|
|
||||||
|
渔业模型 |
|
注意各种“最优”的意义 |
384 |
||||||
最优化 |
模拟退火法 |
|
|
|
|
|||||
神经网络 |
|
|
|
|
||||||
遗传算法 |
|
|
|
|
||||||
分治算法 |
|
|
|
|
||||||
差分进化 |
|
|
|
|
||||||
蚁行算法 |
|
|
|
|
||||||
粒子群 |
|
|
|
|
||||||
不确定 模型 |
灰色系统 |
|
|
|
|
|||||
数理统计 |
|
|
|
|
||||||
模糊数学 |
聚类分析 |
|
|
一、蒙特卡洛算法
又称随机抽样或统计模拟方法,以是一种以概率统计理论为指导的一类非常重要的数值计算方法。此方法使用随机数(或最常见的伪随机数)来解决很多计算问题的方法。由于传统的经验方法不能逼近真实的物理过程,很难得到满意的结果,而蒙特卡洛方法由于能够真实的模拟实际物理过程,故解决问题与实际非常符合,可以得到很满意的结果。
基本原理及思想:当所求解问题是某种随机事件出现的概率,或者是某个随机变量的期望值时,通过某种“实验”的方法,以这种事件出现的频率估计这一随机事件的概率,或者得到这个随机变量的某些数字特征,并将其作为问题的解。
二、数据拟合、参数估计、插值等数据处理方法
我们通常会遇到大量的数据需要处理, 而处理数据的关键就在于这些算法,通常使用Matlab作为工具。数据拟合在数学建模比赛中中有应用,与图形处理有关的问题很多与拟合有关系,一个例子就是98年数学建模美国赛A题,生物组织切片的三维插值处理,94年A题逢山开路,山体海拔高度的插值计算,还有吵的沸沸扬扬可能会考的“非典”问题也要用到数据拟合算法,观察数据的走向进行处理。
此类问题在 MATLAB 中有很多现成的函数可以调用,熟悉MATLAB,这些方法都能游刃有余的用好。
三、线性规划、整数规划、多元规划、二次规划等规划类问题
数学建模竞赛中很多问题都和数学规划有关,可以说不少的模型都可以归结为一组不等式作为约束条件、几个函数表达式作为目标函数的问题,遇到这类问题,求解就是关键了,列举规划后用Lingo、Lindo等软件来进行解决比较方便。
四、图论算法
Dijkstra 、 Floyd 、 Prim 、 Bellman-Ford ,最大流,二分匹配等问题。
五、动态规划、回溯搜索、分治算法、分支定界等计算机算法
六、最优化理论的三大经典算法:模糊退火法、神经网络、遗传算法
遗传算法是计算数学中用于解决最优化的搜索算法,是进化算法的一种。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择和杂交等。
遗传算法通常实现方式是一种计算机模拟。对于一个最优化问题,一定数量的候选解(称为个体)的抽象表示(称为染色体)的种群向更好的解进化。传统上,解用二进制表示,但也可以用其他表示方法。进化从完全随机个体的种群开始,之后一代一代发生。在每一代中,整个种群的适应度被评价,从当前种群中随机的选择多个个体(基于他们的适应度),通过自然选择和突变产生新的生命种群,该种群在算法的下一次迭代中成为当前种群。
七、网络算法和穷举法
网格算法和穷举法一样,只是网格法是连续问题的穷举。
比如要求在N个变量情况下的最优化问题,那么对这些变量可取的空间进行采点。
比如在 [ a; b ] 区间内取 M +1 个点,就是 a; a +( b ? a ) =M; a +2 ¢ ( b ? a ) =M ; …;b
那么这样循环就需要进行 ( M + 1) N 次运算,所以计算量很大。
八、一些连续离散化方法
大部分物理问题的编程解决,都和这种方法有一定的联系。物理问题是反映我们生活在一个连续的世界中,计算机只能处理离散的量,所以需要对连续量进行离散处理。
这种方法应用很广,而且和上面的很多算法有关。事实上,网络算法、蒙特卡洛算法、模拟退火都用了这个思想。
九、数值分析方法
数值分析是数学的一个分支,主要研究连续数学问题的算法。
如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比 如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用。
这类算法是针对高级语言而专门设的,如果你用的是 MATLAB 、 Mathematica ,大可不必准备,因为像数值分析中有很多函数一般的数学软件是具备的。
十、图像处理算法
在数学建模竞赛中:比如01 年 A 题中需要你会读 BMP 图象、美国赛 98 年 A 题需要你知道三维插值计算, 03 年 B 题要求更高,不但需要编程计算还要进行处理,而数模论文中也有很多图片需要展示,因此图象处理就是关键。做好这类问题,重要的是把MATLAB 学好,特别是图象处理的部分
§1 线性规划
在人们的生产实践中,经常会遇到如何利用现有资源来安排生产,以取得最大经济效益的问题。此类问题构成了运筹学的一个重要分支—数学规划,而线性规划(Linear
Programming 简记 LP)则是数学规划的一个重要分支。
1.1 线性规划的 Matlab 标准形式
线性规划的目标函数可以是求最大值,也可以是求最小值,约束条件的不等号可以是小于号也可以是大于号。为了避免这种形式多样性带来的不便,Matlab 中规定线性
规划的标准形式为
其中 c 和 x 为 n 维列向量, A 、 Aeq 为适当维数的矩阵, b 、 beq 为适当维数的列向量。
1.2相关问题
运输问题(产销平衡)、指派问题(匈牙利算法)、对偶理论与灵敏度分析、投资的收益和风险
§2 整数规划
2.1 定义
规划中的变量(部分或全部)限制为整数时,称为整数规划。若在线性规划模型中,变量限制为整数,则称为整数线性规划。目前所流行的求解整数规划的方法,往往只适
用于整数线性规划。目前还没有一种方法能有效地求解一切整数规划。
2.2 整数规划的分类
如不加特殊说明,一般指整数线性规划。对于整数线性规划模型大致可分为两类:
1 变量全限制为整数时,称纯(完全)整数规划。
2 变量部分限制为整数的,称混合整数规划。
2.3 整数规划特点
(i) 原线性规划有最优解,当自变量限制为整数后,其整数规划解出现下述情况:
①原线性规划最优解全是整数,则整数规划最优解与线性规划最优解一致。
②整数规划无可行解。
③有可行解(当然就存在最优解),但最优解值变差。
(ii) 整数规划最优解不能按照实数最优解简单取整而获得。
2.4 求解方法分类:
(i)分枝定界法—可求纯或混合整数线性规划。
(ii)割平面法—可求纯或混合整数线性规划。
(iii)隐枚举法—求解“0-1”整数规划:
①过滤隐枚举法;
②分枝隐枚举法。
(iv)匈牙利法—解决指派问题(“0-1”规划特殊情形)。
(v)蒙特卡洛法—求解各种类型规划。
§3 非线性规划
如果目标函数或约束条件中包含非线性函数,就称这种规划问题为非线性规划问题。一般说来,解非线性规划要比解线性规划问题困难得多。而且,也不象线性规划有
单纯形法这一通用方法,非线性规划目前还没有适于各种问题的一般算法,各个方法都有自己特定的适用范围。
3.1 线性规划与非线性规划的区别
如果线性规划的最优解存在,其最优解只能在其可行域的边界上达到(特别是可行域的顶点上达到);而非线性规划的最优解(如果最优解存在)则可能在其可行域的任
意一点达到。
3.2 非线性规划的 Matlab 解法
Matlab 中非线性规划的数学模型写成以下形式
其中f(x)是标量函数, Beq,Aeq,B,A 是相应维数的矩阵和向量, Ceq(x),C(x) 是非线性向量函数。
Matlab 中的命令是
X=FMINCON(FUN,X0,A,B,Aeq,Beq,LB,UB,NONLCON,OPTIONS)
它的返回值是向量 x ,其中 FUN 是用 M 文件定义的函数f(x);X0 是 x 的初始值;A,B,Aeq,Beq 定义了线性约束 Beq= X *Aeq , A*x≤ B,如果没有线性约束,则A=[],B=[],Aeq=[],Beq=[];LB 和 UB 是变量 x 的下界和上界,如果上界和下界没有约束,则 LB=[],UB=[],如果 x 无下界,则 LB 的各分量都为-inf,如果 x 无上界,则 UB的各分量都为 inf;NONLCON 是用 M 文件定义的非线性向量函数Ceq(x),C(x) ;OPTIONS定义了优化参数,可以使用 Matlab 缺省的参数设置。
3.3 相应问题
无约束问题(一维搜索方法、二次插值法、无约束极值问题的解法)、约束极值问题(二次规划、罚函数法)、飞行管理问题
§4 动态规划(搞ACM的较熟)
动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decisionprocess)最优化的数学方法。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。
虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。应指出,动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种特殊算法(如线性规划是一种算法)。因而,它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则,而必须对具体问题进行具体分析处理。因此,在学习时,除了要对基本概念和方法正确理解外,应以丰富的想象力去建立模型,用创造性的技巧去求解。
§5 与网络模型及方法(搞ACM的较熟)
图论中所谓的“图”是指某类具体事物和这些事物之间的联系。如果我们用点表示这些具体事物,用连接两点的线段(直的或曲的)表示两个事物的特定的联系,就得到了描述这个“图”的几何形象。图论为任何一个包含了一种二元关系的离散系统提供了一个数学模型,借助于图论的概念、理论和方法,可以对该模型求解。哥尼斯堡七桥问题就是一个典型的例子。在哥尼斯堡有七座桥将普莱格尔河中的两个岛及岛与河岸联结起来,问题是要从这四块陆地中的任何一块开始通过每一座桥正好一次,再回到起点。
图与网络是运筹学(Operations Research)中的一个经典和重要的分支,所研究的问题涉及经济管理、工业工程、交通运输、计算机科学与信息技术、通讯与网络技术等诸多领域。主要包括最短路问题、最大流问题、最小费用流问题和匹配问题等。
§6 排队论模型(2017年美赛B题,2005年美赛B题主要涉及排队论)
排队是在日常生活中经常遇到的现象,如顾客到商店购买物品、病人到医院看病常常要排队。此时要求服务的数量超过服务机构(服务台、服务员等)的容量。也就是说,到达的顾客不能立即得到服务,因而出现了排队现象。这种现象不仅在个人日常生活中出现,电话局的占线问题,车站、码头等交通枢纽的车船堵塞和疏导,故障机器的停机待修,水库的存贮调节等都是有形或无形的排队现象。由于顾客到达和服务时间的随机性。可以说排队现象几乎是不可避免的。
排队论(Queuing Theory)也称 随机服务系统理论,就是为解决上述问题而发展的一门学科。它研究的内容有下列三部分:
(i)性态问题,即研究各种排队系统的概率规律性,主要是研究队长分布、等待时间分布和忙期分布等,包括了瞬态和稳态两种情形。
(ii)最优化问题,又分静态最优和动态最优,前者指最优设计。后者指现有排队系统的最优运营。
(iii)排队系统的统计推断,即判断一个给定的排队系统符合于哪种模型,以便根据排队理论进行分析研究。
6.1 排队系统的组成和特征
一般的排队过程都由输入过程、排队规则、服务过程三部分组成,现分述如下:
6.1.1 输入过程
输入过程是指顾客到来时间的规律性,可能有下列不同情况:
(i)顾客的组成可能是有限的,也可能是无限的。
(ii)顾客到达的方式可能是一个—个的,也可能是成批的。
(iii)顾客到达可以是相互独立的,即以前的到达情况对以后的到达没有影响;否则是相关的。
(iv)输入过程可以是平稳的,即相继到达的间隔时间分布及其数学期望、方差等数字特征都与时间无关,否则是非平稳的。
6.1.2 排队规则
排队规则指到达排队系统的顾客按怎样的规则排队等待,可分为损失制,等待制和混合制三种。
(i)损失制(消失制)。当顾客到达时,所有的服务台均被占用,顾客随即离去。
(ii)等待制。当顾客到达时,所有的服务台均被占用,顾客就排队等待,直到接受完服务才离去。例如出故障的机器排队等待维修就是这种情况。
(iii)混合制。介于损失制和等待制之间的是混合制,即既有等待又有损失。有队列长度有限和排队等待时间有限两种情况,在限度以内就排队等待,超过一定限度就离去。
排队方式还分为单列、多列和循环队列。
6.1.3 服务过程
(i)服务机构。主要有以下几种类型:单服务台;多服务台并联(每个服务台同时为不同顾客服务);多服务台串联(多服务台依次为同一顾客服务);混合型。
(ii)服务规则。按为顾客服务的次序采用以下几种规则:
①先到先服务,这是通常的情形。
②后到先服务,如情报系统中,最后到的情报信息往往最有价值,因而常被优先处理。
③随机服务,服务台从等待的顾客中随机地取其一进行服务,而不管到达的先后。
④优先服务,如医疗系统对病情严重的病人给予优先治疗。
§7 对策论(搞ACM的较熟)
对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。
在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对抗性质的行为称为 对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。
§8 层次分析法
层次分析法(Analytic Hierarchy Process,简称 AHP)是对一些较为复杂、较为模糊的问题作出决策的简易方法,它特别适用于那些难于完全定量分析的问题。
层次分析法的基本原理与步骤
人们在进行社会的、经济的以及科学管理领域问题的系统分析中,面临的常常是一个由相互关联、相互制约的众多因素构成的复杂而往往缺少定量数据的系统。层次分析法为这类问题的决策和排序提供了一种新的、简洁而实用的建模方法。运用层次分析法建模,大体上可按下面四个步骤进行:
(i)建立递阶层次结构模型;
(ii)构造出各层次中的所有判断矩阵;
(iii)层次单排序及一致性检验;
(iv)层次总排序及一致性检验。
下面分别说明这四个步骤的实现过程。
8.1 递阶层次结构的建立与特点
应用 AHP 分析决策问题时,首先要把问题条理化、层次化,构造出一个有层次的结构模型。在这个模型下,复杂问题被分解为元素的组成部分。这些元素又按其属性及关系形成若干层次。上一层次的元素作为准则对下一层次有关元素起支配作用。
这些层次可以分为三类:
(i)最高层:这一层次中只有一个元素,一般它是分析问题的预定目标或理想结果,因此也称为目标层。
(ii)中间层:这一层次中包含了为实现目标所涉及的中间环节,它可以由若干个层次组成,包括所需考虑的准则、子准则,因此也称为准则层。
(iii)最底层:这一层次包括了为实现目标可供选择的各种措施、决策方案等,因此也称为措施层或方案层。
递阶层次结构中的层次数与问题的复杂程度及需要分析的详尽程度有关,一般地层次数不受限制。每一层次中各元素所支配的元素一般不要超过 9 个。这是因为支配的元素过多会给两两比较判断带来困难。
层次分析法的应用
在应用层次分析法研究问题时,遇到的主要困难有两个:(i)如何根据实际情况抽象出较为贴切的层次结构;(ii)如何将某些定性的量作比较接近实际定量化处理。
层次分析法对人们的思维过程进行了加工整理,提出了一套系统分析问题的方法,为科学管理和决策提供了较有说服力的依据。但层次分析法也有其局限性,主要表现在:
(i)它在很大程度上依赖于人们的经验,主观因素的影响很大,它至多只能排除思维过程中的严重非一致性,却无法排除决策者个人可能存在的严重片面性。(ii)比较、判断过程较为粗糙,不能用于精度要求较高的决策问题。AHP 至多只能算是一种半定量(或定性与定量结合)的方法。
在应用层次分析法时,建立层次结构模型是十分关键的一步。
§9 插值与拟合
插值:求过已知有限个数据点的近似函数。
拟合:已知有限个数据点,求近似函数,不要求过已知数据点,只要求在某种意义下它在这些点上的总偏差最小。
插值和拟合都是要根据一组数据构造一个函数作为近似,由于近似的要求不同,二者的数学方法上是完全不同的。而面对一个实际问题,究竟应该用插值还是拟合,有时容易确定,有时则并不明显。
插值方法
几种基本的、常用的插值:拉格朗日多项式插值、牛顿插值、分段线性插值、Hermite 插值和三次样条插值。
曲线拟合的线性最小二乘法(线性最小二乘法)
最小二乘优化(lsqlin 函数、lsqcurvefit 函数、lsqnonlin 函数、lsqnonneg 函数)
§10 数据的统计描述和分析
数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是以概率论为基础的一门应用学科。数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息的数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据,使之系统化、条理化,以显示出数据资料的趋势、特征和数量关。它是统计推断的基础,实用性较强,在统计工作中经常使用。面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计的最基本方法。我们将用Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析。
---------------------
原文:https://blog.csdn.net/sanganqi_wusuierzi/article/details/54800341