主页

NLP-对比学习-SimCSE

文章来源 SimCSE: Simple Contrastive Learning of Sentence Embeddings [GitHub - princeton-nlp/SimCSE: EMNLP 2021] SimCSE: Simple Contrastive Learning of Sentence Embeddings https://arxiv.org/abs/2104.08821 Introduction Our unsupervised SimCSE simply predicts the input sentence itself with only dropout (Srivastava et al., 2014) used as noise (Figur...

阅读更多

NLP-RoBERTa

论文:[1907.11692] RoBERTa: A Robustly Optimized BERT Pretraining Approach 代码:GitHub - facebookresearch/fairseq: Facebook AI Research Sequence-to-Sequence Toolkit written in Python. Introduction Motivation: Training is computationally expensive, often done on private datasets of different sizes, and, as we will show, hyperparameter choices have ...

阅读更多

NLP-ERNIE

文章来源 文章链接:[1904.09223] ERNIE: Enhanced Representation through Knowledge Integration code: GitHub - PaddlePaddle/ERNIE: The official repository for ERNIE 4.5 and ERNIEKit – its industrial-grade development toolkit based on PaddlePaddle. Introduction Motivation These works do not consider the prior knowledge in the sentence. For example, In t...

阅读更多

NLP-Albert

l 论文:[1909.11942] ALBERT: A Lite BERT for Self-supervised Learning of Language Representations 代码:https://github.com/google-research/ALBERT Introduction Motivation: 应对GPU/TPU memory limitations and longer training times。this study present two parameter reduction techniques to lower memory consumption and increase the training speed of BERT...

阅读更多

使用免费AI完成初步文献综述

前言 本教程适用于某一领域的初步探索,快速了解该领域当前的研究问题、研究方法、研究结论,这些信息也可以辅助论文撰写时文献综述部分的写作。 该方法不适用于做文献的精读,如果想做文献精读可以用这个工具智谱清言,强烈推荐 检索并下载文献的题录 使用web of science 下载文献的题录信息,(一定要包含摘要),存储格式为.ris 然后导入到zotero。这个步骤相信大多数人都会,就不再赘述 使用AI+zotero插件总结文献 原理: 通过zotero插件调用免费的大模型API,对文献的题录信息(标题、摘要、关键词)进行快速总结,返回表格形式的 研究问题、研究方法、研究结论 step1 下载并安装zotero的GPT插件 这是插件的介绍 Awesome ...

阅读更多

因果推断笔记-相关VS因果

声明: 以下内容是书 Causal Inference: What If 的阅读笔记,作者主页miguelhernan.org可以下载对应的pdf 以下内容使用deepseek辅助创作 从相关(association)到因果(causation) 相关vs因果 对于经济学的人来说应该不会有什么困惑,但对于计算机领域做算法预测的人来说是比较容易引起混淆。对于管理领域不做因果推断的人(比如之前的我)时常感到费解,因为最初是直接看的机器学习、深度学习,直接去做预测,或者找与目标结果相关的影响因素(factors),其实说到这个词的时候就很犹豫,这个影响因素到底是相关还是因果? 最初错误的理解因素这个词就是因果效应,经常把特征feature, characteristics和因素挂钩...

阅读更多

因果推断笔记-个体因果效应到平均因果效应

声明: 以下内容是书 Causal Inference: What If 的阅读笔记,作者主页miguelhernan.org可以下载对应的pdf 因果推断笔记-从个体因果效应(individual causal effects)到平均因果效应(average causal effects) 假设你需要知道是否治疗(treatment)对某个患者的效果(存活或者死亡)。比如患者正在考虑是否做心脏手术: 选择: 做手术(记作A=1) 不做手术(记作A=0) 结果: 死亡(记作Y=1) 存活(记作Y=0) 关键点:是否治疗A=1 OR A=0产生两种潜在的结果(pote...

阅读更多

Linux下MongoDB的安装与使用

前言 大多数情况下是用不到MongoDB的,直接存储在csv或者json即可。以下是比较适合用MongoDB存储的情况 抓数据 数据规模极大,起码百万+ 频繁查找字段 文本格式的数据 字典格式的数据 不适用于 图像、视频、音频数据存储。这种建议采用字段索引的方式,将key和数据分离存储,将数据存储到单独存储到一个文件夹,其中文件名作为MongoDB的字段访问。 Linux下MongoDB的安装与使用 安装 直接跟着以下教程一步一步安装就行,亲测有效 在Ubuntu22.04中安装MongoDB6.0(2024年1月版)_厦大数据库实验室博客 (xmu.edu.cn) 常用命令 # 查看状态 sudo systemctl status...

阅读更多