主页

使用免费AI完成初步文献综述

前言 本教程适用于某一领域的初步探索,快速了解该领域当前的研究问题、研究方法、研究结论,这些信息也可以辅助论文撰写时文献综述部分的写作。 该方法不适用于做文献的精读,如果想做文献精读可以用这个工具智谱清言,强烈推荐 检索并下载文献的题录 使用web of science 下载文献的题录信息,(一定要包含摘要),存储格式为.ris 然后导入到zotero。这个步骤相信大多数人都会,就不再赘述 使用AI+zotero插件总结文献 原理: 通过zotero插件调用免费的大模型API,对文献的题录信息(标题、摘要、关键词)进行快速总结,返回表格形式的 研究问题、研究方法、研究结论 step1 下载并安装zotero的GPT插件 这是插件的介绍 Awesome ...

阅读更多

因果推断笔记-相关VS因果

声明: 以下内容是书 Causal Inference: What If 的阅读笔记,作者主页miguelhernan.org可以下载对应的pdf 以下内容使用deepseek辅助创作 从相关(association)到因果(causation) 相关vs因果 对于经济学的人来说应该不会有什么困惑,但对于计算机领域做算法预测的人来说是比较容易引起混淆。对于管理领域不做因果推断的人(比如之前的我)时常感到费解,因为最初是直接看的机器学习、深度学习,直接去做预测,或者找与目标结果相关的影响因素(factors),其实说到这个词的时候就很犹豫,这个影响因素到底是相关还是因果? 最初错误的理解因素这个词就是因果效应,经常把特征feature, characteristics和因素挂钩...

阅读更多

因果推断笔记-个体因果效应到平均因果效应

声明: 以下内容是书 Causal Inference: What If 的阅读笔记,作者主页miguelhernan.org可以下载对应的pdf 因果推断笔记-从个体因果效应(individual causal effects)到平均因果效应(average causal effects) 假设你需要知道是否治疗(treatment)对某个患者的效果(存活或者死亡)。比如患者正在考虑是否做心脏手术: 选择: 做手术(记作A=1) 不做手术(记作A=0) 结果: 死亡(记作Y=1) 存活(记作Y=0) 关键点:是否治疗A=1 OR A=0产生两种潜在的结果(pote...

阅读更多

Linux下MongoDB的安装与使用

前言 大多数情况下是用不到MongoDB的,直接存储在csv或者json即可。以下是比较适合用MongoDB存储的情况 抓数据 数据规模极大,起码百万+ 频繁查找字段 文本格式的数据 字典格式的数据 不适用于 图像、视频、音频数据存储。这种建议采用字段索引的方式,将key和数据分离存储,将数据存储到单独存储到一个文件夹,其中文件名作为MongoDB的字段访问。 Linux下MongoDB的安装与使用 安装 直接跟着以下教程一步一步安装就行,亲测有效 在Ubuntu22.04中安装MongoDB6.0(2024年1月版)_厦大数据库实验室博客 (xmu.edu.cn) 常用命令 # 查看状态 sudo systemctl status...

阅读更多

交叉学科(混合方法)研究的优势与痛苦-如何合作产出论文

前言 近几年期刊要求水涨船高,遥想2020年左右深度学习、机器学习刚在计算机领域大杀特杀,当时随便拿个一般的特征工程加个基本的机器学习模型就能投IPM;计量模型要求不需要十分严谨就能发DSS,IR;现在再按照之前的做法,投IR,IPM,直接就是Desk Reject,问就是方法没有创新,计量不严谨,理论薄弱。 也不全是坏处,起码现在对混合方法(Mixed Method,或者Design Science)的包容度越来越高,对信息系统IS领域来说其实是好事,因为咱这个领域不就是各种方法交叉混合嘛,从问卷、算法、到计量真就应有尽有。个人感受最大的一个好处是,信息系统能跟上AI、大数据这波潮流,肉眼可见的是大家用的数据越来越大,现在动则几十万的数据,那确实能观察到更多的现象,这样子做出来的...

阅读更多

信息系统领域论文写作Tips及资料推荐

前言 不同学科偏好差异巨大,本文专门针对IS领域的文章进行介绍。 一般来说,大部分论文会包含这几个部分 introduction, method,result及discussion 我们主要关注管理+计算机+心理学领域的论文,所以这里以这三个领域作简单的分析。 计算机写作篇幅精炼,注重方法的阐述(这是最核心的贡献),这其实和研究问题比较相关,因为他们大多问题都是很具体的(如情感分类,商品推荐等),所以不需要耗费大量的篇幅去阐述关于研究问题的motivation或者说背景意义。 心理学篇幅和计算机相差不大,但更注重实验结果或者发现(其实也是蛮合理的,大多时候他们会做很多实验,比如招患者来做实验,所以发现的新结论或者现象是重点),对所用方法的介绍会很简短。 管理领域,非常非常注...

阅读更多

我们的研究改变世界了吗?

最近一个周连续参加了CSWIM, SWAIB会议,说了太多话,e人浓度瞬间从100%降到了0%,感觉这三天都不想再说话了 好消息是做的主题(心理健康➕社交媒体)看到了蛮多类似的研究,也收获了大佬的鼓舞,坏消息是一篇文章想实现的目标过多,且策略有点过于激进(好坏参半),好的是确实很有趣,坏的是容易引起争议,最初蛮让自己内耗的,过后冷静下来又觉得,引起争议更证明了研究的意义。 时间线回到三四个月前,当时做的论文感觉工作量上处于尴尬的level,向上是一篇毕业的top,向下是1/3的普通论文,这对于博二初的自己来说确实是一个艰难的抉择,内耗了接近一个月。然后遇到了同样内耗的师姐(申请青基中),神奇的她因为骨折的原因emo了很久,然后想做心理健康(能带来职业成就感)方向,然后她根据我之前的...

阅读更多

词嵌入经典方法:one-hot,TF-IDF,Bag of words

词嵌入的经典方法-独热编码(one hot),词袋模型(bag of words),词文档-逆文档频率(TF-IDF) 1 one-hot(独热编码) intuition(核心思想) ​ 文档中每个单词的出现都是独立的,每个词都有独一无二的含义,与其它词无关。对单词编码后的向量中只有数字 0 和 1,且其中只有一个维度是 1 案例: ​ 给出一句话,I ate an apple and played the piano。输出词典表示 劣势 ​ 稀疏矩阵;高维;无法学习语义,向量间的距离无法反映语义差异, 应用: ​ 输出类别标注 2.bag of words intuition(核心思想):文...

阅读更多