NLP-对比学习-SimCSE
文章来源
SimCSE: Simple Contrastive Learning of Sentence Embeddings
[GitHub - princeton-nlp/SimCSE: EMNLP 2021] SimCSE: Simple Contrastive Learning of Sentence Embeddings https://arxiv.org/abs/2104.08821
Introduction
Our unsupervised SimCSE simply predicts the input sentence itself with only dropout (Srivastava et al., 2014) used as noise (Figur...
NLP-RoBERTa
论文:[1907.11692] RoBERTa: A Robustly Optimized BERT Pretraining Approach
代码:GitHub - facebookresearch/fairseq: Facebook AI Research Sequence-to-Sequence Toolkit written in Python.
Introduction
Motivation: Training is computationally expensive, often done on private datasets of different sizes, and, as we will show, hyperparameter choices have ...
NLP-ERNIE
文章来源
文章链接:[1904.09223] ERNIE: Enhanced Representation through Knowledge Integration
code: GitHub - PaddlePaddle/ERNIE: The official repository for ERNIE 4.5 and ERNIEKit – its industrial-grade development toolkit based on PaddlePaddle.
Introduction
Motivation
These works do not consider the prior knowledge in the sentence. For example, In t...
NLP-Albert
l
论文:[1909.11942] ALBERT: A Lite BERT for Self-supervised Learning of Language Representations
代码:https://github.com/google-research/ALBERT
Introduction
Motivation: 应对GPU/TPU memory limitations and longer training times。this study present two parameter reduction techniques to lower memory consumption and increase the training speed of BERT...
使用免费AI完成初步文献综述
前言
本教程适用于某一领域的初步探索,快速了解该领域当前的研究问题、研究方法、研究结论,这些信息也可以辅助论文撰写时文献综述部分的写作。
该方法不适用于做文献的精读,如果想做文献精读可以用这个工具智谱清言,强烈推荐
检索并下载文献的题录
使用web of science 下载文献的题录信息,(一定要包含摘要),存储格式为.ris 然后导入到zotero。这个步骤相信大多数人都会,就不再赘述
使用AI+zotero插件总结文献
原理:
通过zotero插件调用免费的大模型API,对文献的题录信息(标题、摘要、关键词)进行快速总结,返回表格形式的 研究问题、研究方法、研究结论
step1 下载并安装zotero的GPT插件
这是插件的介绍 Awesome ...
因果推断笔记-相关VS因果
声明:
以下内容是书 Causal Inference: What If 的阅读笔记,作者主页miguelhernan.org可以下载对应的pdf
以下内容使用deepseek辅助创作
从相关(association)到因果(causation)
相关vs因果 对于经济学的人来说应该不会有什么困惑,但对于计算机领域做算法预测的人来说是比较容易引起混淆。对于管理领域不做因果推断的人(比如之前的我)时常感到费解,因为最初是直接看的机器学习、深度学习,直接去做预测,或者找与目标结果相关的影响因素(factors),其实说到这个词的时候就很犹豫,这个影响因素到底是相关还是因果?
最初错误的理解因素这个词就是因果效应,经常把特征feature, characteristics和因素挂钩...
因果推断笔记-个体因果效应到平均因果效应
声明:
以下内容是书 Causal Inference: What If 的阅读笔记,作者主页miguelhernan.org可以下载对应的pdf
因果推断笔记-从个体因果效应(individual causal effects)到平均因果效应(average causal effects)
假设你需要知道是否治疗(treatment)对某个患者的效果(存活或者死亡)。比如患者正在考虑是否做心脏手术:
选择:
做手术(记作A=1)
不做手术(记作A=0)
结果:
死亡(记作Y=1)
存活(记作Y=0)
关键点:是否治疗A=1 OR A=0产生两种潜在的结果(pote...
Linux下MongoDB的安装与使用
前言
大多数情况下是用不到MongoDB的,直接存储在csv或者json即可。以下是比较适合用MongoDB存储的情况
抓数据
数据规模极大,起码百万+
频繁查找字段
文本格式的数据
字典格式的数据
不适用于
图像、视频、音频数据存储。这种建议采用字段索引的方式,将key和数据分离存储,将数据存储到单独存储到一个文件夹,其中文件名作为MongoDB的字段访问。
Linux下MongoDB的安装与使用
安装
直接跟着以下教程一步一步安装就行,亲测有效
在Ubuntu22.04中安装MongoDB6.0(2024年1月版)_厦大数据库实验室博客 (xmu.edu.cn)
常用命令
# 查看状态
sudo systemctl status...
共计 28 篇文章,4 页。