0%

TIP-2021 Re-Attention for Visual Question Answering

发表于 2021-11-21 更新于 2026-05-16

CVPR2021 跨模态检索-Learning the Best Pooling Strategy for Visual Semantic Embedding(GPO)

发表于 2021-11-01 更新于 2026-05-16 分类于论文

思想

Visual Semantic Embedding(VSE)是跨模态检索中的常见方法。旨在学习一个嵌入空间，具有相同语义的视觉和文本在空间中距离相近。然而现在的VSE方法使用复杂的方法将多模态的信息聚合为整体特征。例：注意力加权，图神经网络，seq2seq。本文发现了使用简单的池化策略进行特征聚合在跨模态检索任务上可以超越复杂模型的性能。池化策略聚合特征具有简单和有效性，但是如何在不同模态的数据上进行聚合特征，本文提出了generalized pooling operator（GPO）自动学习最佳池化策略。

阅读全文 »

图文预训练综述

发表于 2021-07-23 更新于 2026-05-16 分类于论文，综述

组会0715-多模态预训练 (maiimg.com)

阅读全文 »

预训练模型综述

发表于 2021-07-23 更新于 2026-05-16 分类于论文，综述

预训练模型综述

[2106.07139] Pre-Trained Models: Past, Present and Future (arxiv.org)

阅读全文 »

VAE-自编码器

发表于 2021-06-22 更新于 2026-05-16 分类于机器学习，生成模型

Auto-Encoder

阅读全文 »

Transformer

发表于 2021-05-16 更新于 2026-05-16 分类于论文， NLP

Transformer

论文：Attention is All you Need (aminer.cn)

阅读全文 »

宝藏资源分享

发表于 2021-05-05 更新于 2026-05-16 分类于资源

宝藏资源收藏分享

本文整理了我目前觉得还算不错的GitHub资源，分为NLP、深度学习和基本知识

阅读全文 »

关于Django中连接MySQL报错的解决方法

发表于 2021-05-05 更新于 2026-05-16 分类于 python ， Django

关于Django中连接mysql数据库报错的解决方法：RuntimeError: ‘cryptography’ package is required for sha256_password or caching_sha2_password auth methods

一、问题发现

安装MySQL8的条件下，在Django中连接MySQL数据库时会发生如下错误：

阅读全文 »

dataframe的一些用法

发表于 2021-05-05 更新于 2026-05-16 分类于 python

pandas中Dataframe的一些用法

pandas读取excel文件

pd.read_excel 前提是安装xlrd库

阅读全文 »

cookie与session的区别于联系

发表于 2021-05-05 更新于 2026-05-16 分类于基础知识

cookie和session

对比

cookie:以键值对的形式保存在客户端浏览器上的信息
session:以键值对的形式保存在服务端上的信息

阅读全文 »