使用免费AI完成初步文献综述
前言
本教程适用于某一领域的初步探索,快速了解该领域当前的研究问题、研究方法、研究结论,这些信息也可以辅助论文撰写时文献综述部分的写作。
该方法不适用于做文献的精读,如果想做文献精读可以用这个工具智谱清言,强烈推荐
检索并下载文献的题录
使用web of science 下载文献的题录信息,(一定要包含摘要),存储格式为.ris 然后导入到zotero。这个步骤相信大多数人都会,就不再赘述
使用AI+zotero插件总结文献
原理:
通过zotero插件调用免费的大模型API,对文献的题录信息(标题、摘要、关键词)进行快速总结,返回表格形式的 研究问题、研究方法、研究结论
step1 下载并安装zotero的GPT插件
这是插件的介绍 Awesome ...
因果推断笔记-相关VS因果
声明:
以下内容是书 Causal Inference: What If 的阅读笔记,作者主页miguelhernan.org可以下载对应的pdf
以下内容使用deepseek辅助创作
从相关(association)到因果(causation)
相关vs因果 对于经济学的人来说应该不会有什么困惑,但对于计算机领域做算法预测的人来说是比较容易引起混淆。对于管理领域不做因果推断的人(比如之前的我)时常感到费解,因为最初是直接看的机器学习、深度学习,直接去做预测,或者找与目标结果相关的影响因素(factors),其实说到这个词的时候就很犹豫,这个影响因素到底是相关还是因果?
最初错误的理解因素这个词就是因果效应,经常把特征feature, characteristics和因素挂钩...
因果推断笔记-个体因果效应到平均因果效应
声明:
以下内容是书 Causal Inference: What If 的阅读笔记,作者主页miguelhernan.org可以下载对应的pdf
因果推断笔记-从个体因果效应(individual causal effects)到平均因果效应(average causal effects)
假设你需要知道是否治疗(treatment)对某个患者的效果(存活或者死亡)。比如患者正在考虑是否做心脏手术:
选择:
做手术(记作A=1)
不做手术(记作A=0)
结果:
死亡(记作Y=1)
存活(记作Y=0)
关键点:是否治疗A=1 OR A=0产生两种潜在的结果(pote...
Linux下MongoDB的安装与使用
前言
大多数情况下是用不到MongoDB的,直接存储在csv或者json即可。以下是比较适合用MongoDB存储的情况
抓数据
数据规模极大,起码百万+
频繁查找字段
文本格式的数据
字典格式的数据
不适用于
图像、视频、音频数据存储。这种建议采用字段索引的方式,将key和数据分离存储,将数据存储到单独存储到一个文件夹,其中文件名作为MongoDB的字段访问。
Linux下MongoDB的安装与使用
安装
直接跟着以下教程一步一步安装就行,亲测有效
在Ubuntu22.04中安装MongoDB6.0(2024年1月版)_厦大数据库实验室博客 (xmu.edu.cn)
常用命令
# 查看状态
sudo systemctl status...
交叉学科(混合方法)研究的优势与痛苦-如何合作产出论文
前言
近几年期刊要求水涨船高,遥想2020年左右深度学习、机器学习刚在计算机领域大杀特杀,当时随便拿个一般的特征工程加个基本的机器学习模型就能投IPM;计量模型要求不需要十分严谨就能发DSS,IR;现在再按照之前的做法,投IR,IPM,直接就是Desk Reject,问就是方法没有创新,计量不严谨,理论薄弱。
也不全是坏处,起码现在对混合方法(Mixed Method,或者Design Science)的包容度越来越高,对信息系统IS领域来说其实是好事,因为咱这个领域不就是各种方法交叉混合嘛,从问卷、算法、到计量真就应有尽有。个人感受最大的一个好处是,信息系统能跟上AI、大数据这波潮流,肉眼可见的是大家用的数据越来越大,现在动则几十万的数据,那确实能观察到更多的现象,这样子做出来的...
信息系统领域论文写作Tips及资料推荐
前言
不同学科偏好差异巨大,本文专门针对IS领域的文章进行介绍。
一般来说,大部分论文会包含这几个部分 introduction, method,result及discussion
我们主要关注管理+计算机+心理学领域的论文,所以这里以这三个领域作简单的分析。
计算机写作篇幅精炼,注重方法的阐述(这是最核心的贡献),这其实和研究问题比较相关,因为他们大多问题都是很具体的(如情感分类,商品推荐等),所以不需要耗费大量的篇幅去阐述关于研究问题的motivation或者说背景意义。
心理学篇幅和计算机相差不大,但更注重实验结果或者发现(其实也是蛮合理的,大多时候他们会做很多实验,比如招患者来做实验,所以发现的新结论或者现象是重点),对所用方法的介绍会很简短。
管理领域,非常非常注...
我们的研究改变世界了吗?
最近一个周连续参加了CSWIM, SWAIB会议,说了太多话,e人浓度瞬间从100%降到了0%,感觉这三天都不想再说话了
好消息是做的主题(心理健康➕社交媒体)看到了蛮多类似的研究,也收获了大佬的鼓舞,坏消息是一篇文章想实现的目标过多,且策略有点过于激进(好坏参半),好的是确实很有趣,坏的是容易引起争议,最初蛮让自己内耗的,过后冷静下来又觉得,引起争议更证明了研究的意义。
时间线回到三四个月前,当时做的论文感觉工作量上处于尴尬的level,向上是一篇毕业的top,向下是1/3的普通论文,这对于博二初的自己来说确实是一个艰难的抉择,内耗了接近一个月。然后遇到了同样内耗的师姐(申请青基中),神奇的她因为骨折的原因emo了很久,然后想做心理健康(能带来职业成就感)方向,然后她根据我之前的...
词嵌入经典方法:one-hot,TF-IDF,Bag of words
词嵌入的经典方法-独热编码(one hot),词袋模型(bag of words),词文档-逆文档频率(TF-IDF)
1 one-hot(独热编码)
intuition(核心思想)
文档中每个单词的出现都是独立的,每个词都有独一无二的含义,与其它词无关。对单词编码后的向量中只有数字 0 和 1,且其中只有一个维度是 1
案例:
给出一句话,I ate an apple and played the piano。输出词典表示
劣势
稀疏矩阵;高维;无法学习语义,向量间的距离无法反映语义差异,
应用:
输出类别标注
2.bag of words
intuition(核心思想):文...
共计 23 篇文章,3 页。