查看原文
其他

本科生毕业论文写作指南

LaTeX工作室 2024-03-18

本文是厦门大学计算机林琛教授写给本科生的指南。非常用心,希望对大家的日常写作有所帮助。原文地址:https://xmudm.github.io/teaching/thesis/

写在最前面的话

这是一份简要的说明,仅供我指导的本科生毕业论文写作时参考。本说明是基于我指导本科生毕业论文写作的经历,针对部分同学从未写作过科技文献的痛点,提炼出的最简化、最基础、最可操作的写作指导。本说明绝不是最优的论文写作指导,如果有疑问,请和我当面讨论。对于没有基础的本科生,如无必要,请严格按照指导步骤写作,包括但不限于行文顺序、英文翻译、内容格式等。因为本说明中强调的每一个字,都是基于我真实遇到的错误。本说明中大部分范例是虚构的,部分范例(图片)来自其他论文,版权归属原作者所有。

在写作之前,请牢记原创原则:

  1. 不要抄袭任何已经发表的、未发表但不是你创作的、或者网络上搜索到的文字
  2. 不要"复制粘贴"网络上的或者论文中的图片

摘要

写 1 段就可以,按照以下顺序,每点写 1-2 句。

  1. 研究的背景

  2. 研究的价值

  3. 研究的难点

  4. 本文的研究内容、使用的模型

  5. 实验和结果

    以下,本说明以“面向社交媒体的推荐系统”这一题目举例。注意,本例属于虚构,不保证其论点的正确性和前沿性。

近年来,互联网的发展趋势是从用户被动消费内容的传统媒体向用户主动创建和分享内容的社交媒体转变。
由于用户创造内容的极大丰富,引发了严重的信息过载问题。能够自动分析用户潜在需求的推荐技术具有广泛的应用价值,受到了研究者和工业界的重视。
然而,社交媒体往往伴随用户社交关系,如何利用其提高推荐结果的准确度是一个较具挑战性的难题。
本文提出了一种面向社交媒体的推荐方法。该方法在矩阵分解框架中,融入了用户社交关系,使用了贝叶斯非参数方法来对用户进行自动分组,并使每组用户产生差异化的特征。
在4个真实数据集上的实验表明,本文提出的推荐方法获得了较好的推荐结果(HitRatio@5=0.8)。通过和当前主流方法的对比,证明了该方法能够产生更准确的个性化推荐结果。

目录

下面列出目录结构和对应的英文翻译

目录(Table of contents)

  1. 绪论 (Introduction)

    1. 研究背景(Research Background)
    2. 研究目标(Research Goals)
  2. 相关工作( Literature Survey)

  3. 面向社交媒体的推荐方法(Recommending on Social Media) 斜体文字是说明:写你自己的工作

    1. 问题定义( problem definition)
    2. 模型(Model)_斜体文字是说明:也可能是方法(methodology),算法(algorithm)_
    3. 本章小结(Summary)
  4. 实验(Experiments)

    1. 实验设置(Experimental Setup)
    2. 实验结果分析(Results and Analysis)
    3. 本章小结(Summary)
  5. 总结与展望(Conclusions and Future Work)

  6. 致谢(Acknowledgements)

  7. 参考文献(Bibliography)

  8. 附录(Appendices)

    第三章的题目按照你的毕设工作,其英文翻译可以有多种方式,示例如下

1. 英文用名词: Personalized Social Media Recommendation
2. 英文用动名词: Recommending on Social Media
3. 不能写动词:Recommend Social Media

绪论

在这一章以及后续章节中,都严谨地安排段落。除了后续有特殊说明的章节外,每一段都采用如下的写作手法:

  • 一个自然段只写一个意思,有太多意思要表达必须分段。

  • 每个自然段都按照 总-分 或者 总-分-总 展开。尽量把主题句放在第一句,后面跟 3-4 个细节展开,最后总结。

  • 调整语序,尽量让每一句话中旧概念先出现,新概念后出现,并且这句话的后半段和下一句话的开头相衔接。

  • 一个段落差不多 1/3 页长。调整文字长度、图表大小,不要出现整页大片的空白。一个段落里的句子长度要有长有短。

  • 行文风格严谨。不使用口语化句子,杜绝“啊,呢”等语气助词的使用,杜绝口语词汇、方言、网络用语和口头禅(除了自然语言处理的论文中用来举例),杜绝感叹号,尽量避免滥用形容词(如“得到了非常高的准确率”),使用简洁的用词和语法结构,保持每一句的完整语法结构,不使用翻译腔的拗口复杂长句等。

以下示例展现了上面的写作手法:

推荐系统有效地解决了互联网上的信息过载问题[1]。
信息过载指的是:互联网上海量的内容超过了个人所能有效处理的范围,阻碍了用户获取自己感兴趣的内容[2]。
为了过滤出用户感兴趣的内容,推荐系统通过挖掘用户的行为记录,预测出用户对不同内容的偏好程度。
根据推荐系统的执行任务不同,可以分为评分预测推荐[3]和topK推荐[4]。
目前,推荐系统广泛应用在各种决策支持应用中,成功地在电子商务中为用户推荐商品[5],在媒体网站为用户推荐音乐或者电影[6],在社交网站推荐好友[7]等等。

研究背景

写 4-6 个自然段,按照以下顺序,每点写 1-2 个自然段。

  1. 时代背景。如互联网的高速增长带来了大量的社交媒体内容。建议带图,图例可以是互联网的社交媒体数量增长折线图。
  2. 动机。如社交媒体是人们获取信息的重要渠道,信息爆炸带来了信息过载问题,引出面向社交媒体的推荐系统的必要性。
  3. 研究现状。简单地概括现有的方法,特别是和你采用的方法相关的。
  4. 现有研究方法的不足。如社交媒体伴随社交关系,现有推荐系统缺少利用社交关系提高推荐准确性的处理方法。

研究目标

写 3-5 个自然段,按照以下顺序,每点写 1-2 个自然段。

  1. 简介研究目标。介绍问题定义和研究目标。如面向社交媒体的推荐系统的输入是用户对不同内容的评分、用户之间的社交关系网络,输出是用户对不同内容的预测评分,目标是学习一个模型能更好的让预测评分拟合观测评分,难点是评分和社交关系网络的稀疏性。
  2. 简介研究内容。介绍你将从哪些方面探索该问题,为什么这些探索可以达到研究目标。建议带图。
  3. 研究意义总结。如社交媒体上的推荐系统的重大经济价值,对其他领域的理论意义等。
  4. 本文组织架构。介绍论文有几章,每一章的主要内容。

相关工作

相关工作这一章应该包含至少 20 篇不同的引用文献,大部分的文献应该是发表于正式的刊物上,至少包含 5 篇近 3 年发表在CCF 推荐期刊和会议的论文。

应该介绍和本论文相关的研究领域,至少要两个类别。如推荐系统相关工作,深度学习相关工作。

每个类别按照如下结构,对所有相关工作先按照时间顺序进行梳理,然后把性质相同的工作放在一组,特别是继承和改进的工作。每个工作(或者每组工作)的简单介绍写 1 个自然段。

  1. 早期工作
  2. 近年来工作
  3. 相关工作总结和不足

引用

在相关工作章大量需要引用,但引用不止发生在相关工作章节里。在绪论和模型、实验章节中也经常是必需的。简单来说,凡是用到了别人的观点,提到了别人的模型名字,参考了别人的图,引用了别人的数据,或者是希望读者去看别人已发表的论文,都需要引用。

引用的部分用双引号“ ”表明是原文照录。如果不是原文而是自己重述,不需要用双引号。

多个论文可以在一次引用中出现。例如,

CNN模型近年来成功应用在图像识别中[2,3,4,5]。

引用[]不可以在一句话开头,一般可用以下方法:

1,放到句末:近年来,已有一些研究人员尝试使用了矩阵分解框架[1-3]。
2,用作者名字:Li 等人[7]提出使用矩阵分解算法。
3, 用文献:在文献[10]中使用了矩阵分解算法。
4,直接使用模型名字:MF[9]分解用户评分矩阵。
5,直接引述观点:使用社交网络关系被证明能提高推荐的准确度[5]。

凡是图片参考了别人的论文重新绘制,或者直接使用了来自别人论文的论文,必须在图表标题上写明:

图1. Transformer模型框架图,参考[1]绘制。
图2. ABC,图片来自[2]。

凡是在正文中提到引用文献用上标或者方框,采用按照人名排序或者按照出现顺序排序。请自行根据厦门大学本科生毕业论文模板确认。

如果需要引用的是网址,用脚注。

外国人名、模型方法名,一般不翻译成中文。

模型章节

问题定义

一般至少包含两个自然段+一个表格。

  1. 其中一个自然段介绍本论文的符号规则。
本文中使用小写字母表示下标或者索引,大写字母表示常量,斜体粗体小写字母表示向量,粗体大写字母表示矩阵,花体表示集合。
  1. 至少一个自然段介绍问题的格式化定义,包括问题的输入、输出等。请仿照你阅读过的相关论文写。

  2. 把全文模型中出现的符号,值域,定义,汇总成一个表。

    符号描述
    a {0,1}a 是一个描述硬币状态的二元变量,a=1 代表硬币正面朝上,否则 a=0 代表硬币反面朝上。

模型

按照以下顺序写作,每点包含多个自然段。可以在每点开始的自然段,使用加黑体的关键字(如框架、输入、输出等)做标识。

  1. 框架。简单介绍模型采用了什么框架。必须带图。模型框架图请仿照你阅读过的相关论文。关于图表的更多要求见后。
  2. 输入。详细介绍模型的输入,带公式,带解释。
  3. 由输入至输出每层或者每步具体操作。每个操作至少一个自然段。每个操作都应有(1)文字描述动机或者物理意义,(2)公式说明准确的操作,(3)重要的操作步骤要带示意图解释。
  4. 输出。详细介绍模型的输出,带公式,带解释。
  5. 损失函数。详细介绍模型的损失函数,带公式,带解释。
  6. 优化算法。详细介绍使用的优化算法,最好带一个表描述算法步骤。
  • 在模型和实验步骤的段落写作中,建议使用顺序的逻辑结构,并用明显的连接词,如”首先,其次,然后……“等,结合分段技巧,得到清晰、流畅的论文。

数字和数学符号

全文中涉及到数字和数学符号的部分都要注意以下几点:

  • 使用数学环境写数字和数学符号。这一项有很多个细节,包括但不限于:(1)word 中用公式环境,不要简单地用英文字母糊弄;(2)不要使用全角符号;(3)公式里不带中文;(4)图表里,如果是希腊字母要正确的写,不能用发音(如"用 lambda 代替 ")或者是相似字母(如”用 a 代替 “)。

  • 所有的符号和术语要保持全文一致。符号遵循统一的规则,有一致的字体、上下标规则。概念术语和定义的短语在全文中一个字都不能变化,并且其对应符号没有变动。这也是为什么要在 3.1 问题定义这一章节专门用一个自然段介绍本论文的符号规则和一个表格列出所有的符号。这可以帮助大家检查数学符号的定义。

  • 公式前后不要有多余的空行。公式要编号。并且每个公式都带有解释。

  • 阿拉伯数字和字母一般用半角,占半个汉字位置。十以内的数字用汉字,如五;十以上的数字用阿拉伯数字,如 15;后面带单位、符号的用阿拉伯数字,如 4.1%;表示序号的用阿拉伯数字,如图 1。一句话不以阿拉伯数字开头,如果开头要用汉字。

  • 涉及具体数据表达,单位名称和符号的书写方式,应采用国际通用符号,不翻译成中文。

实验

实验设置

按照以下顺序,每点至少写 1 个自然段

  1. 实验数据集。该段必须带一个表格。介绍本论文使用的数据集有几个,为什么使用这些数据集,怎么得到的,以及他们的统计信息。
  2. 实验环境。介绍本论文运行实验的硬件环境(机器、集群型号及配置),软件环境(编程实现的平台版本)等。
  3. 评估指标。介绍实验中使用的评估指标,为什么使用这些评估指标,以及他们的计算方式。该段必须带引用(举例哪篇论文使用过同样的评估指标)。必须带公式(计算方式)。
  4. 比较实验方法。介绍实验中使用来做对比的方法(包括本文的方法)。建议以列表的方式,每个对比方法简单介绍 1 小段,必须带引用,必须给出参数设定的方法(网格搜索、交叉验证等)或者具体值。

实验结果分析

接下来只列出对本科毕设论文实验最基本的要求:按照以下顺序,每点至少 一个图表(展现实验结果)+1 个自然段(分析)

  1. 对比实验。该实验目的是对比本文方法和其他方法的优劣。一般以表格形式展现实验结果,附带 1-2 个自然段的结果分析。

  • 表格格局一般如下例所示,每个数据集一个表,多个对比实验方法按行排列,多个评估指标按列排列,在每列中表现最优的那个方法的结果加黑。表格中评估指标和方法名字一般不翻译成中文。

    表 1:在 ABC 数据集上的推荐效果,最优的结果加粗标出。

    方法HitRatio@5NDCG@5MRR@5
    MF0.20.30.4
    PMF0.30.40.5
  • 结果分析段落的写作如下。(1)以这样的句式开头:“表 x 展示了 xxx 的结果”。(2)给出各方法好坏的总结性结论,按行(方法)比,也可以按列(指标)比,还可以按数据集比。如“可以看出,xxx 方法在各数据集上/评估指标上都取得了最好的结果”。或者”可以看出,在 xxx 数据集上,各方法都取得了最好的结果“。(3)给出具体的数值,如“其 NDCG@5 超过了 0.75”。(4)分析原因,解释为什么这个方法比较好,或者比较差。

  • 描述时注意:尽量避免使用形容词而用量化的(“得到了很高的准确率”改为“准确率达到 80%”)。此外,十以内的数字用字,如五;十以上的数字用阿拉伯数字,如 15;后面带单位、符号的用阿拉伯数字,如 4.1%;表示序号的用阿拉伯数字,如图 1。一句话不以阿拉伯数字开头,如果开头要用汉字。

  • 参数敏感性实验。该实验目的是测试本文方法中主要参数的不同设置对结果的影响。一般以折线图展现实验结果,附带 1-2 个自然段的结果分析。本文中,由于使用的图表相似,此类实验还包括收敛性实验,即展示损失函数(或评估指标)随着轮数变化的实验。

    • 折线图一般以变化的参数作为 x 轴,参数变化的范围一般是等间隔的,如''x=1,2,3,4,5';而不是"x=1,4,5"。以某个评估指标为 y 轴,可以按需采用对数坐标。不同方法可以使用不同颜色的折线和图例。

    • 结果分析段落的写作如下。(1)以这样的句式开头:”图 x 展示了 xxx 的结果。“。(2)对图表的描述,例如,” 图 x 中,x 轴是参数 xx 从 xx 到 xx 的变化,y 轴是 xxx(不同比较实验方法)的 xxx 指标结果“。(3)图中结果可以分点展示,例如”从图 x 中可以看出(1)……(2)……“(4)比较性结论,哪种方法最好,好多少,或者所有方法的效果排序。(5)趋势性结论。例如,”参数 x 越大,RMSE 越小;或者随着参数 x 的增大,RMSE 值先增大后减小“。(6)分析原因,解释该趋势出现的原因。

    图表

    • 使用高清晰度的图片。这指的是(1)不要用网上或者别人论文里剪切粘贴来的图;(2)可以使用各种绘图软件,包括但不限于 visio,powerpoint,matlab,python 自己绘制的图,并恰当地保存成了高清图片,而不是用屏幕截图;(3)图片里面的所有文字,包括坐标轴标签等,都设置了合适的字体(建议加粗)和字号(建议 18 号以上),在论文里可以看清楚;(4)图片的背景(建议不要加网格背景)、颜色(建议不要靠颜色区分不同系列)和图例(建议调整到足够大)经过了调整,使得黑白打印的论文也可以清晰辨别出不同系列的数据。
    • 图中文字能写中文的不写英文。
    • 图片不要设计得太空,应该以能紧凑的占满 3/4 的页面宽度为宜。一般情况表格里不断行。图表不跨页。
    • 对齐。表头、图表标题居中。同一张表格里的对齐方式应该一致,没有出现一张表格里某些格子左对齐,某些格子右对齐。

    参考文献

    • 参考文献严格按照 GB/T 7714-2005 规则,详见厦大本科毕业论文规范。
    • 可以使用文献管理工具+正确的样式+科研数据库得到的引用文件。特别提醒不要用百度查!不用 Google Scholar 查!很容易引用不正确。应该用图书馆主页进去的科研数据库,包括 IEEE Explorer, ACM DL,ELSEVIER 等,也可以用DBLP 。
    • 以下提醒常见的错误
      • 文献是会议论文集时,书写格式为:” [序号] 作者. 文章题目[C]. 主编. 论文集名, 出版地:出版单位, 出版年份:起止页码. “ 其中,会议论文的论文集名不要简写。例如 不要写成 In SIGIR,而是写成 Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval 页码前面要不要加 pages,或者 pp.,或者不加,要统一。主编、出版地、出版单位不要遗漏。
      • 区分文献是期刊文章、会议论文集、专著和学位论文的符号”[J].[M]. [D]. "不要遗漏。
    • 只使用以上四种类型文献(期刊文章、会议论文集、专著和学位论文),不要使用其他类型或者未定义类型文献。如果需要引用网址,用脚注。

    检查清单

    毕业论文写完后要进行多次、交叉校阅。特别注意格式规范问题,以下清单列举了常见的格式规范问题。请在通篇校阅后逐一核对。

    • 页码:目录页不需加页号。目录中必须标明页码。目录中的内容,摘要等用罗马数字编页码,第一章绪论从数字 1 开始编页码。

    • 论文结构和内容:严格按照上述说明写作。

    • 语法:所有正文中的文本没有语病,包括中英文。每一句都是完整的语法结构。符合科技论文写作规范和文风。

    • 空白:所有的首段空两格。公式后没有空白。除非是每一章节结束,否则每一页不应该有大量空白。图表紧凑,图表中不能有大量的空白。没有跨页跨栏的图表。文字间距宽度应该一致(包括图表与正文的文字间距),公式和图表后没有多余的空行。

    • 标点符号:(1)没有遗漏标点符号,特别是带编号的文本,加粗的文本(作为提示用的,例如:本章亮点。)图表的标题(长标题应该有句号结尾,短语型标题不需要标点符号),公式后的逗号或者句号,以及一些特定的用法(如:其中,并排的观点(1)(2)(3)后面要加分号或者句号等)。公式的标点符号:如果公式后带解释,公式应该有逗号,否则要有句号。多行公式有逗号。公式后的其中等解释没有缩进。(2)正确的标点符号。中文应该用中文标点,abstract 和图表目录英文版里用英文标点。各种标点符号没有混用。

    • 数学:(1)所有的公式、数学符号都用数学环境。包括图表里的数学符号。(2)一致性:所有的定义和数学符号一致!有一致的字体、上下标规则,一致的术语、名词,一致的解释。所有的缩写是一致的。每个缩写在每一章第一次出现的时候,应该给出全称。如:_隐含狄利克雷分布_(Latent Dirichlet Allocation, 简称 LDA)。(3)减少行内公式,尽量横着写,不应该太长。(4)独立公式尽量竖着写。(5)凡是重要的公式都应该独立并编号。多行公式不重复编号。(6)每个公式和第一次出现的数学符号都有文本解释。

    • 格式:(1)对齐:表头、图表标题居中。同一张表格里的对齐方式应该一致,没有出现一张表格里某些格子左对齐,某些格子右对齐。(2)字号一致。使用 Word 要特别注意字号的统一并符合格式要求。(3)参考文献的格式正确,务必多次确认厦大本科毕业论文规范。

    文章选自:https://xmudm.github.io/teaching/thesis/

    点击阅读原文

    获取下载文件

    继续滑动看下一个
    向上滑动看下一个

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存