A PHP Error was encountered

Severity: Notice

Message: Undefined index: lang

Filename: ConferenceStatistics/MainPage.php

Line Number: 80

KDD 2018 | Acemap
KDD 2018
Commerce and Profiling
Paper Name & Summary Author(s)
Perceive Your Users In Depth: Learning Universal User Representations From Multiple E-commerce Tasks

本文研究了E-commerece中的个性化。

Yabo Ni , Dan Ou , Shichen Liu , Xiang Li , Wenwu Ou , Anxiang Zeng , Luo Si
E-tail Product Return Prediction Via Hypergraph-based Local Graph Cut

本文研究了E-tail的问题,通过允许他们在任何地方购买零售产品而无需访问实际商店,为客户提供了极大的便利。

Jianbo Li , Jingrui He , Yada Zhu
OpenTag: Open Attribute Value Extraction From Product Profiles

本文研究了缺失属性值的提取。

Guineng Zheng , Subhabrata Mukherjee , Xin Luna Dong , Feifei Li
Learning And Transferring IDs Representation In E-commerce

许多机器智能技术是在电子商务中开发的,其中一个最基本的组件是ID的表示。 作者提出了一种基于嵌入的框架来学习和转移ID的表示。

Kui Zhao , Yuechuan Li , Zhaoqian Shuai , Cheng Yang
I Know You’ll Be Back: Interpretable New User Clustering And Churn Prediction On A Mobile Social App

作者在大规模按需乘坐平台上提出了一种新颖的订单调度算法。

Carl Yang , Xiaolin Shi , Jie Luo , Jiawei Han
Deep Learning I
Paper Name & Summary Author(s)
Exact And Consistent Interpretation For Piecewise Linear Neural Networks: A Closed Form Solution

本文研究由深度神经网络驱动的强大智能机器。作者提出了一个名为OpenBox的优雅闭合形式解决方案,用于计算分段线性神经网络(PLNN)族的精确一致解释。

Lingyang Chu , Xia Hu , Juhua Hu , Lanjun Wang , Jian Pei
Voxel Deconvolutional Networks For 3D Brain Image Labeling

在这项工作中,作者提出了体素反卷积层(VoxelDCL)来解决3D空间中反卷积层的棋盘伪像问题。

Yongjun Chen , Hongyang Gao , Lei Cai , Min Shi , Dinggang Shen , Shuiwang Ji
Deep Variational Network Embedding In Wasserstein Space

本文研究网络嵌入。现实世界网络的形成和演变充满了不确定性。作者在本文中提出了一种新的深度变分网络嵌入Wasserstein空间(DVNE)。

Dingyuan Zhu , Peng Cui , Daixin Wang , Wenwu Zhu
Subspace Network: Deep Multi-Task Censored Regression For Modeling Neurodegenerative Diseases

本文研究数字媒体中的供应方平台(SSP)。作者设计并试验了Thompson Sampling算法的一个版本

Mengying Sun , Inci M. Baytas , Liang Zhan , Zhangyang Wang , Jiayu Zhou
Towards Explanation Of DNN-based Prediction With Guided Feature Inversion

本文研究深度神经网络(DNN)。作者建议研究一个引导特征反演框架,以利用深层架构进行有效解释。

Mengnan Du , Ninghao Liu , Qingquan Song , Xia Hu
Deep Learning II
Paper Name & Summary Author(s)
XiaoIce Band: A Melody And Arrangement Generation Framework For Pop Music

作者提出了一个关于流行音乐生成的重点研究。他们提出了一种名为XiaoIce Band的端到端旋律和排列生成框架,该框架生成一个旋律音轨,其中包含几种类型乐器演奏的几首伴奏音轨。他们还提出了一种多仪器共同安排模型(MICA),它使用多任务学习来进行多轨音乐安排。

Hongyuan Zhu , Qi Liu , Nicholas Jing Yuan , Chuan Qin , Jiawei Li , Kun Zhang , Guang Zhou , Furu Wei , Yuanchun Xu , Enhong Chen
Deep R-th Root Rank Supervised Joint Binary Embedding For Multivariate Time Series Retrieval

本文涉及多变量时间序列数据。作者提出了一个深度第r级的秩监督联合二进制嵌入(Deep r-RSJBE)来执行多变量时间序列检索。

Dongjin Song , Ning Xia , Wei Cheng , Haifeng Chen , Dacheng Tao
Cost-Effective Training Of Deep CNNs With Active Model Adaptation

本文研究深度卷积神经网络。作者建议通过积极地将预先训练的模型应用于具有较少标记示例的新任务来克服这些挑战。

Sheng-Jun Huang , Jia-Wei Zhao , Zhao-Yang Liu
Learning Deep Network Representations With Adversarially Regularized Autoencoders

本文研究网络嵌入。作者建议学习具有对称正规化自动编码器(NetRA)的网络表示。

Wenchao Yu , Cheng Zheng , Wei Cheng , Charu Aggarwal , Dongjin Song , Bo Zong , Haifeng Chen , Wei Wang
Smoothed Dilated Convolutions For Improved Dense Prediction

本文研究扩张卷积。作者通过研究扩张卷积的分解提出了两种简单但有效的降水方法。

Zhengyang Wang , Shuiwang Ji
Graph and Social Network I
Paper Name & Summary Author(s)
Multi-Round Influence Maximization

本文研究了多轮影响最大化(MRIM)问题。 MRIM问题模拟病毒式营销场景,其中广告商进行多轮病毒式营销以推广一种产品。

Lichao Sun , Weiran Huang , Philip Yu , Wei Chen
SpotLight: Detecting Anomalies In Streaming Graphs

作者提出了一种名为SpotLight的随机草图绘制方法,该方法可以保证异常图形远离草图空间中的“正常”实例,并且具有适当选择参数的高概率。

Dhivya Eswaran , Christos Faloutsos , Sudipto Guha , Nina Mishra
Adversarial Attacks On Neural Networks For Graph Data

本文研究了深度学习模型对图的鲁棒性。作者介绍了对属性图的对抗性攻击的第一项研究,特别关注利用图形卷积思想的模型。

Daniel Zügner , Amir Akbarnejad , Stephan Günnemann
Graph Classification Using Structural Attention

在许多实际应用中,图形可能有噪声,只有图中某些区域的判别模式才会受到影响。作者研究了基于注意力的图分类问题。

John Boaz Lee , Ryan Rossi , Xiangnan Kong
EvoGraph: An Effective And Efficient Graph Upscaling Method For Preserving Graph Properties

本文研究了合成图生成方法。 作者提出了一种名为EvoGraph的新型图形放大方法,它可以放大原始图形,同时保留其属性而不管比例因子如何。

Himchan Park , Min-Soo Kim
Graph and Social Network II
Paper Name & Summary Author(s)
Network Connectivity Optimization: Fundamental Limits And Effective Algorithms

本文研究网络连接优化。首先,作者通过证明,对于广泛的网络连接优化问题,揭示了一些基本限制,(1)它们是NP难的,(2)(1-1 / e)是任何多项式算法的最佳逼近比。其次,他们提出了一种有效的,可扩展的通用算法(CONTAIN)来仔细平衡优化质量和计算效率。

Chen Chen , Ruiyue Peng , Lei Ying , Hanghang Tong
Opinion Dynamics With Varying Susceptibility To Persuasion

本文研究社会心理学。作者采用了一种流行的社会舆论动态模型,并将干预措施发生在易感性水平上的意见最大化和最小化问题形式化。

Rediet Abebe , Jon Kleinberg , David Parkes , Charalampos Tsourkakis
Node Similarity With Q-Grams For Real-World Labeled Networks

本文利用在通向节点的有界长度q的路径中找到的标签序列,研究标记网络中的节点相似性。

Roberto Grossi , Alessio Conte , Gaspare Ferraro , Andrea Marino , Kunihiko Sadakane , Takeaki Uno
NetLSD: Hearing The Shape Of A Graph

本文研究图形比较。作者提出了网络拉普拉斯光谱描述符(NetLSD)

Anton Tsitsulin , Davide Mottin , Panagiotis Karras , Alexander Bronstein , Emmanuel Muller
LARC: Learning Activity-Regularized Overlapping Communities Across Time

本文研究社区。作者提出了LARC,一种直接从时间交互数据联合学习重叠社区结构和社区活动时期的一般框架。

Alexander Gorovits , Ekta Gujral , Evangelos Papalexakis , Petko Bogdanov
FASTEN: Fast Sylvester Equation Solver For Graph Mining

本文研究了西尔维斯特方程。作者提出了一系列基于Krylov子空间的算法(紧固)来加速和扩大Sylvester方程的图形挖掘计算。

Boxin Du , Hanghang Tong
Knowledge Discovery
Paper Name & Summary Author(s)
An Efficient Two-Layer Mechanism For Privacy-Preserving Truth Discovery

本文研究征求在线用户的答案。作者提出了基于扰动的机制,为用户提供隐私保证并保持汇总答案的准确性。

Yaliang Li , Chenglin Miao , Lu Su , Jing Gao , Qi Li , Bolin Ding , Zhan Qin , Kui Ren
TINET: Learning Invariant Networks Via Knowledge Transfer

本文研究基于神经的多任务学习。为了避免过度耗费时间和资源消耗的网络构建过程,作者提出了TINET,一种基于知识转移的模型,用于加速不变的网络构建。

Chen Luo , Zhengzhang Chen , Lu-An Tang , Anshumali Shrivastava , Zhichun Li , Haifeng Chen , Jieping Ye
R-VQA: Learning Visual Relation Facts With Semantic Attention For Visual Question Answering

本文研究视觉问答(VQA)。作者提出了一个新的框架来学习VQA的视觉关系事实。

Pan Lu , Lei Ji , Wei Zhang , Nan Duan , Ming Zhou , Jianyong Wang
Can Who-Edits-What Predict Edit Survival?

本文研究在线同行生产系统。作者探讨了解决方案领域中的一个不同点,它超出了用户的声誉,但不涉及编辑的任何基于内容的功能。

Ali Batuhan Yardim , Victor Kristof
Dynamic Embeddings For User Profiling In Twitter

在本文中,作者研究了Twitter中动态用户分析的问题。他们通过提出动态用户和单词嵌入模型(DUWE),可扩展的黑盒变分推理算法和流式关键字多样化模型(SKDM)来解决该问题。

Shangsong Liang , Xiangliang Zhang , Zhaochun Ren , Evangelos Kanoulas
Generalized Score Functions For Causal Discovery

本文论述了从观测数据中发现因果关系。在本文中,作者基于随机变量之间的一般(条件)独立关系的表征,引入了因果发现的广义评分函数,而没有假设特定的模型类。

Biwei Huang , Kun Zhang , Yizhu Lin , Bernhard Scho?lkopf , Clark Glymour
Matrices, Kernels and Sketches
Paper Name & Summary Author(s)
Disturbance Grassmann Kernels For Subspace-Based Learning

在本文中,作者关注基于子空间的学习问题,其中数据元素是线性子空间而不是向量。提出了Grassmann核来测量空间结构并与分类器一起使用。

Junyuan Hong , Huanhuan Chen , Feng Lin
SUSTain: Scalable Unsupervised Scoring For Tensors And Its Application To Phenotyping

本文提出了一种新方法,我们称之为SUSTain,它将实值矩阵和张量因子分解扩展到值为整数的数据。

Ioakeim Perros , Evangelos Papalexakis , Haesun Park , Richard Vuduc , Xiaowei Yan , Christopher Defilippi , Walter F. Stewart , Jimeng Sun
Discrete Ranking-based Matrix Factorization With Self-Paced Learning

本文研究top-k推荐的效率。作者提出了一种基于离散排序的矩阵分解(DRMF)算法,该算法基于每个用户的成对偏好,并将其制定为二进制二次规划问题以学习二进制代码。

Yan Zhang , Haoyu Wang , Defu Lian , Ivor W. Tsang , Hongzhi Yin , Guowu Yang
High-order Proximity Preserving Information Network Hashing

本文研究信息网络嵌入。作者提出了一种基于MF的下划线信息强调N etwork underlineH灰化(INH-MF)算法,以学习可以保持高阶接近度的二进制代码。

Defu Lian , Kai Zheng , Vincent W. Zheng , Yong Ge , Longbing Cao , Ivor W. Tsang , Xing Xie
Optimal Distributed Submodular Optimization Via Sketching

作者提出了几类子模块优化问题的分布式算法,例如k-cover,集合覆盖,设施位置和概率覆盖。

Mohammadhossein Bateni , Hossein Esfandiari , Vahab Mirrokni
Active Feature Acquisition With Supervised Matrix Completion

本文解决了特征缺失的问题。 在本文中,作者尝试通过联合执行主动特征查询和监督矩阵完成来训练具有最小获取成本的有效分类模型。

Sheng-Jun Huang , Miao Xu , Ming-Kun Xie , Masashi Sugiyama , Gang Niu , Songcan Chen
Medicine and Healthcare
Paper Name & Summary Author(s)
TATC: Predicting Alzheimer’s Disease With Actigraphy Data

作者提出了一种名为时间感知TICC和CNN(TATC)的新型解决方案,用于根据活动记录数据预测AD(阿尔茨海默病)。

Jia Li , Yu Rong , Helen Meng , Zhihui Lu , Timothy Kwok , Hong Cheng
Accelerating Prototype-Based Drug Discovery Using Conditional Diversity Networks

作者开发了一种算法无监督方法,在给定原型药物的情况下自动生成潜在的药物分子。

Shahar Harel , Kira Radinsky
Detection Of Apathy In Alzheimer Patients By Analysing Visual Scanning Behaviour With RNNs

在这项研究中,情绪和非情绪刺激的视觉扫描行为(VSBs)用于检测AD患者的冷漠。十六名患者精神萎靡。

Jonathan Chung , Sarah A. Chau , Nathan Herrmann , Krista L. Lanctôt , Moshe Eizenman
Releasing EHealth Analytics Into The Wild: Lessons Learnt From The SPHERE Project

SPHERE项目致力于在智能家居环境中推进电子卫生保健,并支持全面传感和数据分析,以实现通用医疗保健服务。作者从数据科学的角度描述了我们将该系统带出实验室的经验

Tom Diethe , Mike Holmes , Meelis Kull , Miquel Perello Nieto , Kacper Sokol , Hao Song , Emma Tonkin , Niall Twomey , Peter Flach
Estimating Glaucomatous Visual Sensitivity From Retinal Thickness By Using Pattern-Based Regularizat

青光眼是基于视野灵敏度(VF)诊断的,这是耗时,昂贵且嘈杂的。作者提出了一种新方法,用于估计青光眼中RT的VF。因此,作者可以避免将CNN过度拟合到小尺寸数据。

Hiroki Sugiura , Taichi Kiwaki , Siamak Yousefi , Hiroshi Murata , Ryo Asaoka , Kenji Yamanishi
Methodology I
Paper Name & Summary Author(s)
PCA By Determinant Optimization Has No Spurious Local Optima

本文研究主成分分析(PCA)。经典地,数据集的主成分被解释为保留其大部分“能量”的方向。在本文中,作者将主成分的一种解释视为方向。保留数据集的大部分“体积”。

Raphael Hauser , Armin Eftekhari , Heinrich Matzinger
Sequences Of Sets

本文研究顺序行为。

Austin Benson , Ravi Kumar , Andrew Tomkins
Metric Learning From Probabilistic Labels

本文研究度量学习。作者研究如何从包含概率信息的数据集中有效地学习距离度量,然后针对两种类型的概率标签提出两种新的度量学习机制

Mengdi Huai , Chenglin Miao , Yaliang Li , Qiuling Suo , Lu Su , Aidong Zhang
Count-Min: Optimal Estimation And Tight Error Bounds Using Empirical Error Distributions

本文研究了Count-Min草图。作者推导出新的计数估计量,包括可证明的最优估计量,它在所有情景中最佳或匹配先前的估计量。

Daniel Ting
A Unified Approach To Quantifying Algorithmic Unfairness: Measuring Individual & Group Unfairness Vi

本文通过算法决策研究歧视。作者专注于定义令人满意的算法不公平度量。它们提供了一个合理的通用框架来比较和对比算法预测器的(非)公平性。

Till Speicher , Hoda Heidari , Nina Grgic-Hlaca , Krishna P. Gummadi , Adish Singla , Adrian Weller , Muhammad Bilal Zafar
Methodology II
Paper Name & Summary Author(s)
FAHES: A Robust Disguised Missing Values Detector

本文涉及伪装缺失值(DMV)。在本文中,作者提出了FAHES,一种用于从两个角度检测DMV的稳健系统:DMV作为可检测的异常值和可检测的内点。

Mourad Ouzzani , Nan Tang , Ahmed Elmagarmid , Raul Castro Fernandez , Abdulhakim A. Qahtan
Data Diff: Interpretable, Executable Summaries Of Changes In Distributions For Data Wrangling

数据科学中的许多分析不是一次性项目,而是在多个数据样本上重复进行。作者介绍了数据差异问题,该问题试图将此问题转化为机会。

Charles Sutton , Timothy Hobson , James Geddes , Rich Caruana
New Robust Metric Learning Model Using Maximum Correntropy Criterion

本文研究度量学习。作者通过引入最大的熵标准来处理现实世界的恶意遮挡或腐败,提出了一种新的稳健度量学习方法。

Jie Xu , Lei Luo , Cheng Deng , Heng Huang
Concentrated Differentially Private Gradient Descent With Adaptive Per-Iteration Privacy Budget

迭代算法转换为差分私有算法通常是天真的。

Jaewoo Lee , Daniel Kifer
Learning And Interpreting Complex Distributions In Empirical Data

为了适应经验数据分布,然后以生成方式解释它们,是了解不同学科数据的结构和动态的常见研究范式。该论文的模型可能提供了一个框架,以便在经验数据中拟合复杂的分布,更重要的是,了解它们的生成机制。

Chengxi Zang , Peng Cui , Wenwu Zhu
HeavyGuardian: Separate And Guard Hot Items In Data Streams

数据流处理是许多领域的基本问题。作者提出了一种名为HeavyGuardian的新型数据结构。

Tong Yang , Junzhi Gong , Haowei Zhang , Lei Zou , Lei Shi , Xiaoming Li
Natural Sciences, Sport, and the Application of Controlled Experiments
Paper Name & Summary Author(s)
Using Rule-Based Labels For Weak Supervised Learning: A ChemNet For Transferable Chemical Property P

作者开发了一种利用基于规则的知识培训ChemNet的方法,ChemNet是一种可转移的,可推广的化学性质预测深度神经网络,以弱监督的方式从大型未标记的化学数据库中学习。

Garrett Goh , Charles Siegel , Abhinav Vishnu , Nathan Hodas
Automatic Discovery Of Tactics In Spatio-Temporal Soccer Match Data

本文探讨了从职业足球比赛中收集的事件流数据中自动战术检测的问题。

Tom Decroos , Jan Van Haaren , Jesse Davis
False Discovery Rate Controlled Heterogeneous Treatment Effect Detection For Online Controlled Exper

论文研究在线控制实验。作者提出了统计方法,可以系统和准确地识别任何感兴趣的用户群的异质性治疗效果(HTE)

Yuxiang Xie , Nanyu Chen , Xiaolin Shi
PrePeP – A Tool For The Identification And Characterization Of Pan Assay Interference Compounds

本文研究了Pan Assays干扰化合物(PAINS)。作者正在开发一种预测PAINS的工具PrePeP,并允许专家直观地探索预测的原因。

Maksim Koptelov , Albrecht Zimmermann , Pascal Bonnet , Ronan Bureau , Bruno Crémilleux
Winner’s Curse: Bias Estimation For Total Effects Of Features In Online Controlled Experiments

本文研究在线控制实验。作者调查统计选择偏差并提出一种获得无偏估计的校正方法。

Minyong Lee , Milan Shen
Planning and Forecasting in Finance and Commerce
Paper Name & Summary Author(s)
Customized Regression Model For Airbnb Dynamic Pricing

本文描述了Airbnb部署的定价策略模型,Airbnb是一个共享家庭和体验的在线市场。

Peng Ye , Julian Qian , Jieying Chen , Chen-Hung Wu , Yitong Zhou , Spencer De Mars , Frank Yang , Li Zhang
Large-Scale Order Dispatch In On-Demand Ride-Sharing Platforms: A Learning And Planning Approach

作者在大型按需乘坐平台上提出了一种新颖的订单调度算法。

Zhe Xu , Zhixin Li , Qingwen Guan , Dingshui Zhang , Qiang Li , Junxiao Nan , Chunyang Liu , Wei Bian , Jieping Ye
Optimization Of A SSP’s Header Bidding Strategy Using Thompson Sampling

本文研究数字媒体中的供应方平台(SSP)。作者设计并试验了Thompson Sampling算法的一个版本

Grégoire Jauvion
Applying The Delta Method In Metric Analytics: A Practical Guide With Novel Ideas

本文研究衡量和监控业务绩效的指标。通过论文在大规模A / B测试的度量开发和分析中的实际例子,作者提供了应用Delta方法的实用指南,Delta方法是经典统计文献中最重要的工具之一。

Alex Deng , Ulf Knoblich , Jiannan Lu
Audience Size Forecasting: Fast And Smart Budget Planning For Media Buyers

本文研究广告活动。 作者提供了一种根据广告系列标准估算广告系列展示次数的方法。

Yeming Shi , Claudia Perlich , Rod Hook
Poster Sessions
Paper Name & Summary Author(s)
Fatigue Prediction In Outdoor Runners Via Machine Learning And Sensor Fusion

作者探讨我们是否可以使用机器学习来预测感知运动(RPE)的评级,这是一种经验证的疲劳主观测量,来自户外跑步的人的惯性传感器数据。

Tim Op De Beeck, Wannes Meert, Kurt Schutte, Benedicte Vanwanseele, Jesse Davis
Sketched Follow-The-Regularized-Leader For Online Factorization Machine

本文研究分解机(FM)。作者设计了一种名为Sketched Follow-The-Regularizer-Leader(SFTRL)的新型在线学习算法。

Luo Luo , Wenpeng Zhang , Zhihua Zhang , Wenwu Zhu , Tong Zhang , Jian Pei
Learning From History And Present: Next-item Recommendation Via Discriminatively Exploiting User Beh

本文研究基于会话的建议。作者通过结合用户的历史稳定偏好和当前消费动机,提出了一种新的行为密集神经网络(BINN),用于下一项推荐。

Zhi Li , Hongke Zhao , Qi Liu , Zhenya Huang , Tao Mei , Enhong Chen
Isolation Kernel And Its Effect On SVM

本文研究了直接从数据导出的数据依赖内核。作者介绍了Isolation Kernel,它完全依赖于数据分布,既不需要类信息也不需要显式学习作为分类器。

Kai Ming Ting , Yue Zhu , Zhi-Hua Zhou
SDREGION: Fast Spotting Of Changing Communities In Biological Networks

本文研究疾病进展的分子机制。

Serene W.H. Wong , Chiara Pastrello , Max Kotlyar , Christos Faloutsos , Igor Jurisica
A Real-time Framework For Detecting Efficiency Regressions In A Globally Distributed Codebase

本文研究监控计算和内存利用率指标。本文介绍了在Facebook上设计和使用的端到端回归检测系统。

Martin Valdez-Vivas , Caner Gocmen , Andrii Korotkov , Ethan Fang , Kapil Goenka , Sherry Chen
Discovering Models From Structural And Behavioral Brain Imaging Data

本文研究了图的块模型。作者探索了寻找具有结构网络和多个行为图的块模型。

Zilong Bai , Buyue Qian , Ian Davidson
Next-Step Suggestions For Modern Interactive Data Analysis Platforms

本文研究现代交互式数据分析(IDA)平台。作者介绍了REACT,一种为现代IDA平台设计的推荐系统。

Amit Somech , Tova Milo
An Iterative Global Structure-Assisted Labeled Network Aligner

集成来自异构数据源的数据通常被建模为合并图形。作者提出了一种新的迭代图形对齐器gsaNA,它使用图形的全局结构来显着减小问题的大小,并以最小的信息损失对齐大图形。

Abdurrahman Yaşar
Resolving Abstract Anaphora In Conversational Assistants Using A Hierarchically-stacked RNN

本文研究会话系统。作者提出了一种新颖的解决方案,该解决方案使用分层神经网络,包括BiLSTM层和分层堆叠的maxpool层,以获得每个用户话语的表示,然后获得话语序列的表示。

Prerna Khurana , Puneet Agarwal , Gautam Shroff , Lovekesh Vig
Scalable Optimization For Embedding Highly-Dynamic And Recency-Sensitive Data

以高速方式在这些数据上生成嵌入是一个具有挑战性的问题作者提出了一种嵌套分段树,用于将新近敏感权重方法和扩散策略提高到复杂度,而不是实际中的迭代步骤。

Xumin Chen , Peng Cui , Shiqiang Yang
Learning Tree-based Deep Model For Recommender Systems

本文研究了基于模型的推荐系统方法。作者提出了一种新的基于树的方法,可以提供对数的复杂性。

Han Zhu , Xiang Li , Pengye Zhang , Guozheng Li , Jie He , Han Li , Kun Gai
Identify Susceptible Locations In Medical Records Via Adversarial Attacks On Deep Predictive Models

本文研究电子病历(EHR)。作者提出了一个有效且有效的框架,该框架通过EHR输入学习针对LSTM模型的时间优先最小攻击,并且作者利用该攻击策略来筛选患者的医疗记录并识别易感事件和测量。

Mengying Sun , Fengyi Tang , Jinfeng Yi , Fei Wang , Jiayu Zhou
Web-Scale Responsive Visual Search At Bing

在本文中,作者介绍了在Microsoft Bing中部署的Web级通用视觉搜索系统。

Houdong Hu , Yan Wang , Linjun Yang , Pavel Komlev , Li Huang , Xi Stephen Chen , Jiapei Huang , Ye Wu , Meenaz Merchant , Arun Sacheti
Learning Tasks For Multitask Learning: Heterogenous Patient Populations In The ICU

本文研究了移动性事件预测。在这项工作中,作者提出了一个两步框架,1)学习相关的患者亚组,2)预测多任务框架中不同患者群体的结果,其中每个人群是一个单独的任务。

Harini Suresh , Jen Gong , John Guttag
Multilevel Wavelet Decomposition Network For Interpretable Time Series Analysis

本文研究时间序列分析。作者提出了一种基于小波的神经网络结构,称为多级小波分解网络(mWDN),用于构建时间序列分析的频率感知深度学习模型。

Jingyuan Wang , Ze Wang , Jianfeng Li , Junjie Wu
Not Just Privacy: Improving Performance Of Private Deep Learning In Mobile Cloud

本文研究移动设备上的深度神经网络(DNN)。为了从没有隐私风险的云数据中心中受益,作者设计了一个基于云的框架ARDEN,它跨移动设备和云数据中心划分DNN。

Ji Wang , Jianguo Zhang , Weidong Bao , Xiaomin Zhu , Bokai Cao , Philip S. Yu
Learning Credible Models

重要的是模型能够提供其预测的原因。然而,模型的推理可能不符合既定知识。作者在线性设置中正式定义可信度,并专注于学习既准确又可信的模型的技术。

Jiaxuan Wang , Jeeheh Oh , Haozhu Wang , Jenna Wiens
Deep Censored Learning Of The Winning Price In The Real Time Bidding

作者概括了中奖价格模型,将深度学习模型与不同的分布相结合,并提出了一种算法,以便从历史投标信息中学习,在这里可以观察或部分观察中标价格。

Wush Chi-Hsuan Wu , Mi-Yen Yeh , Ming-Syan Chen
Deep Multi-Output Forecasting: Learning To Accurately Predict Blood Glucose Trajectories

本文研究了多步预测。作者提出了多步输出深度结构用于多步预测,其中作者明确地模拟了预测范围内信号未来值的分布。

Ian Fox , Lynn Ang , Mamta Jaiswal , Rodica Pop-Busui , Jenna Wiens
Learning-to-Ask: Knowledge Acquisition Via 20 Questions

作者研究了20个问题,一个在线互动游戏,其中每个问题 - 答案对对应于目标实体的事实,以几乎零人工成本有效地获得高度准确的知识。作者提出了学习问答(LA)框架,其中代理人分别通过深度强化学习和广义矩阵分解来学习信息搜寻和知识获取的智能提问策略。

Yihong Chen , Bei Chen , Xuguang Duan , Jian-Guang Lou , Yue Wang , Wenwu Zhu , Yong Cao
A Data-Driven Three-Layer Algorithm For Split Delivery Vehicle Routing Problem With 3D Container Loa

本文研究了具有三维加载约束的分裂交付车辆路径问题(3L-SDVRP)。本文的解决方案采用了一种新颖的数据驱动三层搜索算法(DTSA),

Xijun Li , Mingxuan Yuan , Di Chen , Jianguo Yao , Jia Zeng
Coupled Context Modeling For Deep Chit-Chat: Towards Conversations Between Human And Computer

在人与计算机之间进行自动对话被认为是计算机科学中最核心的问题之一。作者提出了一种新颖的上下文建模框架,该框架具有用于人机对话系统的端到端神经网络。

Rui Yan , Dongyan Zhao
Multi-Cast Attention Networks

本文研究了注意力作为一种特征增强形式的新颖用途,即注意力。作者提出了多投射注意网络(MCAN),这是一种新的注意机制和通用模型架构,用于对话建模和问答区域中的排序任务的大杂烩。

Yi Tay , Anh Tuan Luu , Siu Cheung Hui
Deep Reinforcement Learning For Sponsored Search Real-time Bidding

本文研究了出价优化的实时出价(RTB)。本文作者考虑了赞助搜索拍卖中的RTB问题,名为SS-RTB。作者提出了一种用于处理复杂动态环境的强化学习(RL)解决方案。

Jun Zhao , Guang Qiu , Ziyu Guan , Wei Zhao , Xiaofei He
Towards Evolutionary Compression

本文研究压缩卷积神经网络(CNNs)。与直接识别给定CNN中的冗余权重或过滤器相比,本文提出了一种自动消除冗余卷积滤波器的渐进方法。

Yunhe Wang , Chang Xu , Jiayan Qiu , Chao Xu , Dacheng Tao
BigIN4: Instant, Interactive Insight Identification For Multi-Dimensional Big Data

本文研究从多维大数据中识别洞察力。作者介绍了BigIN4,这是一个用于从多维大数据中即时,交互式识别洞察的系统。

Qingwei Lin , Weichen Ke , Jian-Guang Lou , Hongyu Zhang , Kaixin Sui , Yong Xu , Ziyi Zhou , Bo Qiao , Dongmei Zhang
Optimizing Cluster-based Randomized Experiments Under Monotonicity

本文研究基于聚类的随机实验。作者介绍了一种单调性条件,在该条件下,一种新颖的两阶段实验设计允许我们确定两个基于簇的设计中的哪一个产生最小偏差的估计。

Jean Pouget-Abadie , David Parkes , Vahab Mirrokni , Edoardo M. Airoldi
Rotation-Blended CNNs On A New Open Dataset For Tropical Cyclone Image-to-intensity Regression

热带气旋(TC)是一种发生在热带地区的恶劣天气系统。准确估计TC强度对于灾害管理至关重要。作者发布了这样一个基准数据集,这是一个从卫星遥感中收集的新的开放数据集,用于TC图像到强度的估算任务。

Boyo Chen , Buofu Chen , Hsuan-Tien Lin
Detection Of Paroxysmal Atrial Fibrillation Using Attention Based Bidirectional Recurrent Neural Net

本文研究心房颤动(AF)的检测。作者提出了一个基于注意力的深度学习框架,用于从一系列窗口中检测阵发性AF事件。

Supreeth Prajwal Shashikumar , Amit Shah , Gari Clifford , Shamim Nemati
Prediction-time Efficient Classification Using Feature Computational Dependencies

本文研究了模型选择和模型优化过程中的约束。本文提出了一种异构超图来表示特征计算依赖性,然后提出了一种框架,该框架基于给定的特征计算依赖性联合优化准确性和精确的测试时间成本。

Liang Zhao , Amir Alipour-Fanid , Martin Slawski , Kai Zeng
State Space Models For Forecasting Water Quality Variables: An Application In Aquaculture Prawn Farm

介绍了水产养殖对虾池塘昼夜水质参数确定性建模的新方法。

Joel Dabrowski , Ashfaqur Rahman , Andrew George , Stuart Arnold , John McCulloch
StepDeep: A Novel Spatial-temporal Mobility Event Prediction Framework Based On Deep Neural Network

在解决重要问题方面具有巨大潜力,例如通过规划车辆路线和调度运输资源,最大限度地减少乘客等待时间和最大限度地利用运输资源。

Bilong Shen , Xiaodan Liang , Yufeng Ouyang , Miaofeng Liu , Weimin Zheng , Kathleen Carley
Unlocking The Value Of Privacy: Trading Aggregate Statistics Over Private Correlated Data

作者从数据市场中的数据经纪人的角度研究嘈杂的汇总统计交易。他们提出了ERATO,它使aggrEgate统计数据能够实现私有化的相关数据。

Chaoyue Niu , Zhenzhe Zheng , Fan Wu , Shaojie Tang , Xiaofeng Gao , Guihai Chen
DeepInf: Social Influence Prediction With Deep Learning

本文研究了每个用户的有效社会影响预测。

Jiezhong Qiu , Jian Tang , Hao Ma , Yuxiao Dong , Kuansan Wang , Jie Tang
Latent Variable Time-varying Network Inference

作者介绍了潜变量时变图形套索(LTGL),这是一种多变量时间序列图形建模方法,可以考虑隐藏或不可测量因素的影响。

Federico Tomasi , Veronica Tozzo , Saverio Salzo , Alessandro Verri
Device Graphing By Example

作者演示了在进行粗略关联后,测量,跟踪和其他互联网实体如何将多个标识符与单个设备或用户相关联。作者采用贝叶斯相似度算法

Keith Funkhouser , Matthew Malloy , Enis Ceyhun Alp , Phillip Poon , Paul Barford
Optimal Allocation Of Real-Time-Bidding And Direct Campaigns

作者考虑了优化网络发布者通过实时出价获得的收入的问题。

Gre?goire Jauvion , Nicolas Grislain
Approximating The Spectrum Of A Graph

作者研究了近似光谱的问题。它们呈现了一种次线性时间算法,该算法在查询图中的随机节点并选择给定节点的随机邻居的能力的情况下,计算近似的简洁表示。

David Cohen-Steiner , Weihao Kong , Christian Sohler , Gregory Valiant
Context-aware Academic Collaborator Recommendation

本文研究协作者推荐。作者提出了上下文感知协作者推荐(CACR),旨在为人们的上下文限制请求推荐高潜力的新合作者。

Zheng Liu , Xing Xie , Lei Chen
Deep Adversarial Learning For Multi-Modality Missing Data Completion

本文研究了多模态缺失数据完成问题。作者将问题表述为条件图像生成任务,并提出编码器 - 解码器深度神经网络来解决这个问题。

Lei Cai , Zhengyang Wang , Hongyang Gao , Dinggang Shen , Shuiwang Ji
Accelerated Equivalence Structure Extraction Via Pairwise Incremental Search

本文研究了等价结构(ES)提取。作者提出了一种称为成对增量搜索(PIS)的新快速方法。

Seiya Satoh , Yoshinobu Takahashi , Hiroshi Yamakawa
Deep Interest Network For Click-Through Rate Prediction

本文研究点击率预测。作者提出了一种新颖的模型:深度兴趣网络(DIN),它设计一个本地激活单元,以自适应地从特定广告的历史行为中学习用户兴趣的表示。

Guorui Zhou , Xiaoqiang Zhu , Chengru Song , Kun Gai , Ying Fan , Han Zhu , Xiao Ma , Yanghui Yan , Junqi Jin , Han Li
Deploying Machine Learning Models For Public Policy: A Framework

本文研究了机械学习的部署。作者描述了他们为警察实施机器学习早期干预系统(EIS)

Klaus Ackermann , Joe Walsh , Adolfo De Unanue , Hareem Naveed , Andrea Navarrete Rivera , Sun-Joo Lee , Jason Bennett , Michael Defoe , Crystal Cody , Lauren Haynes , Rayid Ghani
Notification Volume Control And Optimization System At Pinterest

作者提出了一种新颖的机器学习方法,用于确定每个用户的通知量,从而优化长期用户参与度。

Bo Zhao , Koichiro Narita , Burkay Orten , John Egan
NGUARD: A Game Bot Detection Framework For NetEase MMORPGs

游戏机器人是自动程序,可以帮助欺骗用户并使他们获得巨大的优势。本文研究游戏机器人检测。为了应对游戏机器人快速变化的特性,作者提出了一种称为NGUARD的MMORPG的广义游戏机器人检测框架,表示网易游戏卫士。

Jianrong Tao , Jiarong Xu , Linxia Gong , Yifu Li , Changjie Fan , Zhou Zhao
On Interpretation Of Network Embedding Via Taxonomy Induction

作者研究网络嵌入的解释,旨在了解实例如何在嵌入空间中分布,以及探索导致嵌入结果的因素。

Ninghao Liu , Xiao Huang , Jundong Li , Xia Hu
A Distributed Quasi-Newton Algorithm For Empirical Risk Minimization With Nonsmooth Regularization

作者提出了一种通信和计算效率高的分布式优化算法,该算法使用二阶信息来解决具有非光滑正则项的ERM问题。

Ching-Pei Lee , Cong Han Lim , Stephen Wright
Accelerating Large-Scale Data Analysis By Offloading To High-Performance Computing Libraries Using A

许多线性代数计算是解决常见机器学习问题的基础,它在使用Spark时比使用高性能计算框架(如消息传递接口(MPI))编写的库要慢得多。

Alex Gittens , Kai Rothauge , Shusen Wang , Michael Mahoney , Lisa Gerhardt , Prabhat , Jey Kottalam , Michael Ringenburg , Kristyn Maschhoff
An Empirical Evaluation Of Sketching For Numerical Linear Algebra

本文研究随机数据降维。这项工作的目标是提供这些方法与替代方法的全面比较。

Yogesh Dahiya , Dimitris Konomis , David P. Woodruff
BagMinHash - Minwise Hashing Algorithm For Weighted Sets

本文研究Minwise散列。 BagMinHash是一种新算法,其速度可以比当前技术水平快几个数量级,而没有对权重或数据维度的任何特定限制或假设。

Otmar Ertl
XStream: Outlier Detection In Feature-Evolving Data Streams

这项工作解决了特征演化流的异常检测问题。作者提出了一种基于密度的集合异常检测器,称为xStream,用于这种更极端的流设置。

Emaad Ahmed Manzoor , Hemank Lamba , Leman Akoglu
HiExpan: Task-Guided Taxonomy Construction By Hierarchical Tree Expansion

本文研究分类法。作者的目标是从特定领域的语料库构建任务引导的分类法,并允许用户输入种子分类法。他们提出了基于扩展的分类学构建框架,即HiExpan。

Jiaming Shen , Zeqiu Wu , Dongming Lei , Chao Zhang , Xiang Ren , Michelle T. Vanni , Brain M. Sadler , Jiawei Han
Anatomy Of A Privacy-Safe Large-Scale Information Extraction System Over Email

本文研究了从电子邮件中提取结构化数据的问题。本文介绍了Juicer,这是一个从电子邮件中提取信息的系统,每天为超过10亿的Gmail用户提供服务。

Ying Sheng , Sandeep Tata , James B. Wendt , Jing Xie , Qi Zhao , Marc Najork
Recurrent Binary Embedding For GPU-Enabled Exhaustive Retrieval From Billion-Scale Semantic Vectors

本文通过穷举搜索研究了十亿次信息检索。本文提出了一种循环二进制嵌入(RBE)模型,该模型学习用于实时检索的紧凑表示。

Ying Shan , Jian Jiao , Jie Zhu , Jc Mao
Deep Learning For Practical Image Recognition: Case Study On Kaggle Competitions

本文研究深度卷积神经网络(DCNN)

Xulei Yang , Zeng Zeng , Sin Teo , Li Wang , Vijay Chandrasekhar , Steven Hoi
Large-Scale Learnable Graph Convolutional Networks

本文研究卷积神经网络(CNN)。为了在大规模图形上进行模型训练,我们提出了一种子图训练方法,以减少现有方法对图形卷积所遭受的过多记忆和计算资源需求。

Hongyang Gao , Zhengyang Wang , Shuiwang Ji
Deep Distributed Fusion Network For Air Quality Prediction

本文研究空气污染。作者提出了一种基于深度神经网络(DNN)的方法(名为DeepAir),它由空间变换组件和深度分布式融合网络组成。

Xiuwen Yi , Junbo Zhang , Zhaoyuan Wang , Tianrui Li , Yu Zheng
Infrastructure Quality Assessment In Africa Using Satellite Imagery And Deep Learning

监测发展中地区的基础设施质量仍然过于昂贵,并阻碍了衡量实现这些目标进展的努力。为此,作者调查了广泛使用的遥感数据在预测非洲基础设施质量方面的作用。

Barak Oshri , Annie Hu , Peter Adelson , Xiao Chen , Pascaline Dupas , Jeremy Weinstein , Marshall Burke , David Lobell , Stefano Ermon
Automated Local Regression Discontinuity Design Discovery

本文研究了在观测数据中推断因果关系的问题。作者开发了第一种用于自动发现回归不连续性设计(RDD)的统计机器学习方法,这是一种经常用于计量经济学的准实验设置

William Herlands , Edward McFowland Iii , Andrew Wilson , Daniel Neill
Autotune: A Derivative-free Optimization Framework For Hyperparameter Tuning

本文研究超参数调整。作者提出了一个名为Autotune的自动并行无衍生优化框架。

Patrick Koch , Oleg Golovidov , Steven Gardner , Brett Wujek , Joshua Griffin , Yan Xu
Fairness Of Exposure In Rankings

本文研究排名。作者提出了一个概念和计算框架,允许在暴露分配方面对排名进行公平约束。

Ashudeep Singh , Thorsten Joachims
Dynamic Recommendations For Sequential Hiring Decisions In Online Labor Markets

本文研究在线劳动力市场。作者提出了一个框架,用于推荐可能被雇用并成功完成手头任务的承包商。

Marios Kokkodis
Route Recommendations For Idle Taxi Drivers: Find Me The Shortest Route To A Customer!

本文研究了向闲置出租车司机推荐路线的问题,以使出租车与预期客户要求之间的距离最小化。作者开发了一种名为MDM的路径推荐引擎:通过蒙特卡罗树搜索最小化距离。与现有技术相比,MDM采用连续学习平台,其中动态更新预测未来客户请求的基础模型。

Nandani Garg , Sayan Ranu
Product Characterisation Towards Personalisation: Learning Attributes From Unstructured Data To Reco

作者描述了解决电子商务中一系列共同挑战的解决方案,这些挑战源于新产品不断被添加到目录中。

Angelo Cardoso , Fabio Daolio
RAIM: Recurrent Attentive And Intensive Modeling Of Multimodal Continuous Patient Monitoring Data

本文研究了医学数据建模的问题。

Yanbo Xu , Siddharth Biswal , Shriprasad Deshpande , Kevin Maher , Jimeng Sun
Deep Sequence Learning With Auxiliary Information For Traffic Prediction

本文研究了在线路径查询预测交通状况的问题。作者打算通过适当整合辅助信息中编码的三种隐含但必要的因素来改进流量预测。

Binbing Liao , Jingqing Zhang , Chao Wu , Douglas McIlwraith , Tong Chen , Shengwen Yang , Yike Guo , Fei Wu
Multi-Label Inference For Crowdsourcing

本文研究了多类多标签注释。作者提出了一种新颖的概率方法,其中包括一个多类多标签依赖(MCMLD)模型,以解决这个问题。

Jing Zhang , Xindong Wu
MIX: Multi-Channel Information Crossing For Text Matching

本文研究短文本匹配。作者介绍了多通道信息交叉的设计,这是一种用于文本匹配的多通道卷积神经网络模型,具有句子和文本语义的附加注意机制。

Haolan Chen , Fred X. Han , Di Niu , Dong Liu , Kunfeng Lai , Chenglin Wu , Yu Xu
Multi-task Representation Learning For Travel Time Estimation

本文在智能交通系统中的任务是根据原点位置,目的地位置以及出发时间估算潜在旅程的持续时间。作者提出了一种用于到达时间估计的多任务表示学习模型(MURAT)。

Yaguang Li , Kun Fu , Zheng Wang , Cyrus Shahabi , Jieping Ye , Yan Liu
Mobile Access Record Resolution On Large-scale Identifier-linkage Graphs

本文研究移动访问记录解析(MARR)问题。作者提出了一个SParse Identifier-linkage Graph(SPI-Graph),它附带了丰富的移动设备分析数据,可以准确地将移动访问记录与设备进行匹配。

Shen Xin , Weizhao Xian , Martin Ester , Hongxia Yang , Zhongyao Wang , Jiajun Bu , Can Wang
An Extensible Event Extraction System With Cross-Media Event Resolution

本文研究从自然语言文本中自动提取突发新闻事件。作者描述了一个大型自动化系统,用于从新闻专线文本和社交媒体中提取自然灾害和重大事件。

Fabio Petroni , Natraj Raman , Timothy Nugent , Armineh Nourbakhsh , Zarko Panic , Sameena Shah , Jochen L. Leidner
Neural Memory Streaming Recommender Networks With Adversarial Training

本文研究了带有流数据输入的ecommender系统。作者提出了一种基于神经记忆网络的流媒体推荐模型。开发了一种基于生成对抗网(GAN)的自适应负抽样框架,以优化论文提出的流媒体推荐模型。

Qinyong Wang , Hongzhi Yin , Zhiting Hu , Defu Lian , Hao Wang , Zi Huang
Buy It Again: Modeling Repeat Purchase Recommendations

重复购买,即多次购买同一产品的顾客,是零售业中的常见现象。本文作者介绍了作者为重复购买建议建模所采用的方法。

Rahul Bhagat , Srevatsan Muralidharan , Alex Lobzhanidze , Shankar Vishwanath
Efficient Mining Of The Most Significant Patterns With Permutation Testing

本文研究了与类标签显着相关的模式提取。作者开发了TopKWY,这是第一个挖掘top-k重要模式的算法,同时严格控制输出的家族错误率,并提供其有效性的理论证据。

Leonardo Pellegrina , Fabio Vandin
Identifying Sources And Sinks In The Presence Of Multiple Agents With Gaussian Process Vector Calcul

在多种药剂系统中,确定观察到的药剂动力学的原因是具有挑战性的。作者提出了GP-LAPLACE,一种用于定位时变场中轨迹的源和汇的技术。

Adam Derek Cobb , Richard Everett , Andrew Markham , Stephen Roberts
Dual Memory Neural Computer For Asynchronous Two-view Sequential Learning

本文研究了捕获视图之间关系的问题。作者提出了一种新的记忆增强神经网络,旨在模拟两个异步顺序视图之间的这些复杂交互。

Hung Le , Truyen Tran , Svetha Venkatesh
D2K: Scalable Community Detection In Massive Networks Via Small-Diameter K-Plexes

本文研究了k-plex,一种众所周知的网络社区伪群模型。本文的目标是在当今的真实世界图中检测大型社区。作者介绍了D2K,它是第一种能够在几分钟内找到超大图的大k-plex的算法。

Alessio Conte , Tiziano De Matteis , Daniele De Sensi , Roberto Grossi , Andrea Marino , Luca Versari
Quantifying And Minimizing Risk Of Conflict In Social Networks

本文研究社交网络中的争议,分歧,冲突,两极分化和意见分歧

Xi Chen , Jefrey Lijffijt , Tijl De Bie
Predicting Estimated Time Of Arrival For Commercial Flights

提高空域效率和容量的一个主要因素是准确预测商业航班的预计到达时间(ETA)。本文作者提出了一种新的商用航班ETA预测系统。

Samet Ayhan , Pablo Costas , Hanan Samet
Adaptive Paywall Mechanism For Digital News Media

许多在线新闻机构利用付费墙机制来增加读者订阅。作者提出了一种自适应付费墙机制,以平衡显示文章的好处与显示付费墙的好处(即终止会话)。

Heidar Davoudi , Aijun An , Morteza Zihayat , Gordon Edall
Career Transitions And Trajectories: A Case Study In Computing

本文研究人工智能的长期职业道路。

Tara Safavi , Maryam Davoodi , Danai Koutra
Parsing To Programs: A Framework For Situated QA

本文介绍了解析程序,这是一个结合解析和概率编程思想的框架,用于定位问答。作为案例研究,作者构建了一个解决大学前水平牛顿物理问题的系统。

Mrinmaya Sachan , Eric P. Xing
Recommendations With Negative Feedback Via Pairwise Deep Reinforcement Learning

作者提出了一种新颖的推荐系统,能够在与用户交互过程中不断改进其策略。

Xiangyu Zhao , Liang Zhang , Zhuoye Ding , Long Xia , Jiliang Tang , Dawei Yin
EANN: Event Adversarial Neural Networks For Multi-Modal Fake News Detection

本文论述社交媒体中的falek新闻。作者提出了一个名为事件对抗性神经网络(EANN)的端到端框架,它可以导出事件不变特征,从而有利于检测新到达事件的假新闻。

Yaqing Wang , Fenglong Ma , Zhiwei Jin , Ye Yuan , Guangxu Xun , Kishlay Jha , Lu Su , Jing Gao
How LinkedIn Economic Graph Bonds Information And Product: Applications In LinkedIn Salary

LinkedIn Salary产品于2016年底推出,旨在为求职者提供有关薪酬分配的见解。一个关键的挑战是,当数据有限或根本没有数据时,可靠地推断出公司层面的洞察力。作者提出了一个两步框架,它利用公司的新颖语义表示(Company2vec)和贝叶斯统计模型。

Xi Chen , Yiqun Liu , Liang Zhang , Krishnaram Kenthapadi
Explanation Mining: Post Hoc Interpretability Of Latent Factor Models For Recommendation Systems

本文研究机器学习算法以推动决策制定。作者提出了一种新方法,通过训练关联矩阵分解黑盒模型输出的关联规则,从潜在因子推荐系统中提取解释

Georgina Peake , Jun Wang
PittGrub: A Frustration-Free System To Reduce Food Waste By Notifying Hungry College Students

本文涉及食物垃圾。作者介绍了PittGrub,这是一个通知系统,可以智能地选择用户邀请参加剩余食物的活动。

Mark Silvis , Anthony Sicilia , Alexandros Labrinidis
Online Adaptive Asymmetric Active Learning For Budgeted Imbalanced Data

本文研究了不平衡无标签数据流的在线主动学习(OAL),其中只能查询标签预算以优化某些对成本敏感的性能指标。作者提出了一种新颖的在线自适应非对称主动(OA3)学习算法,该算法基于新的非对称策略和二阶优化。

Yifan Zhang , Peilin Zhao , Jiezhang Cao , Wenye Ma , Junzhou Huang , Qingyao Wu , Mingkui Tan
Enhancing Predictive Modeling Of Nested Spatial Data Through Group-Level Feature Disaggregation

本文考察了多级建模与多任务学习之间的关系。作者对这两种方法进行了比较分析,以说明它们在应用于两级嵌套数据时的优势和局限性。

Boyang Liu , Pang-Ning Tan , Jiayu Zhou
A Scalable Solution For Rule-Based Part-of-Speech Tagging On Novel Hardware Accelerators

本文研究词性(POS)标记。作者利用两个硬件加速器,自动机处理器(AP)和现场可编程门阵列(FPGA)来加速基于规则的POS标记

Elaheh Sadredini , Deyuan Guo , Chunkun Bo , Reza Rahimi , Hongning Wang , Kevin Skadron
Easing Embedding Learning By Comprehensive Transcription Of Heterogeneous Information Networks

作者建议研究异构信息网络(HINs)的综合转录问题。为了应对HIN综合转录中的挑战,作者提出了HEER算法,该算法通过边缘表示嵌入HIN,并进一步与正确学习的异构度量相结合。

Yu Shi , Qi Zhu , Fang Guo , Chao Zhang , Jiawei Han
On Discrimination Discovery And Removal In Ranked Data Using Causal Graph

作者研究了公平感知排名问题,旨在发现排名数据集中的歧视并重建公平排名。他们建议将排名位置映射到表示候选人资格的连续得分变量。

Yongkai Wu , Lu Zhang , Xintao Wu
Interpretable Representation Learning For Healthcare Via Capturing Disease Progression Through Time

本文研究电子健康记录(EHR)的预测建模。作者提出了一种新的可解释的深度学习模型,称为时间轴。

Tian Bai , Shanshan Zhang , Brian Egleston , Slobodan Vucetic
Learning Structural Node Embeddings Via Diffusion Wavelets

本文研究了学习节点结构表示的问题。作者开发了GraphWave,这是一种通过利用热小波扩散模式通过低维嵌入来表示每个节点的网络邻域的方法。

Claire Donnat , Marinka Zitnik , David Hallac , Jure Leskovec
New Incremental Learning Algorithm For Semi-Supervised Support Vector Machine

本文研究了半监督支持向量机(S3VM)。作者提出了一种新的增量学习算法,在凸度差(DC)编程的框架下,基于路径跟踪技术来扩展S3VM(IL-S3VM)。

Bin Gu , Xiao-Tong Yuan , Songcan Chen , Heng Huang
Inferring Metapopulation Propagation Network For Intra-city Epidemic Control And Prevention

作者认为,城市内的流行病传播应以集合种群为基础,并为此目的提出两步法。

Jingyuan Wang , Xiaojian Wang , Junjie Wu
Billion-scale Commodity Embedding For E-commerce Recommendation In Alibaba

本文研究推荐系统。这些方法基于众所周知的图嵌入框架。

Jizhe Wang , Pipei Huang , Huan Zhao , Zhibo Zhang , Binqiang Zhao , Dik Lun Lee
Multi-Task Learning With Neural Networks For Voice Query Understanding On An Entertainment Platform

本文解决了理解Comcast Xfinity X1娱乐平台语音查询的挑战。作者提出了一种新颖的多任务神经架构,共同学习完成所有三项任务。

Jinfeng Rao , Ferhan Ture , Jimmy Lin
Shield: Fast, Practical Defense And Vaccination For Deep Learning Using JPEG Compression

深度神经网络(DNN)非常容易受到对抗生成的图像的影响。作者将JPEG压缩置于其提出的SHIELD防御框架的核心,利用其有效“压缩”这种像素操作的能力

Nilaksh Das , Madhuri Shanbhogue , Shang-Tse Chen , Fred Hohman , Siwei Li , Li Chen , Michael E. Kounavis , Duen Horng Chau
Safe Triplet Screening For Distance Metric Learning

作者研究了公制学习的安全筛选。

Tomoki Yoshida , Ichiro Takeuchi , Masayuki Karasuyama
PME: Projected Metric Embedding On Heterogeneous Networks For Link Prediction

本文研究了异构信息网络嵌入。为了减轻现有度量学习方法的潜在几何缺乏灵活性,作者提出在单独的对象空间和关系空间而不是在公共空间中构建对象和关系嵌入。

Hongxu Chen , Hongzhi Yin , Weiqing Wang , Hao Wang , Quoc Viet Hung Nguyen , Xue Li
COTA: Improving The Speed And Accuracy Of Customer Support Through Ranking And Deep Networks

本文研究客户问题。本文提出了COTA,这是一种通过自动票证分类和支持代表的答案选择来提高最终用户客户支持的速度和可靠性的系统。

Piero Molino , Huaixiu Zheng , Yi-Chia Wang
Exploring Student Check-In Behavior For Improved Point-of-Interest Prediction

本文研究了兴趣点(POI)预测问题。作者提出了一种异构的基于图形的方法来编码用户,POI和活动之间的相关性,然后共同学习顶点的嵌入。

Mengyue Hang , Ian Pytlarz , Jennifer Neville
Variable Selection And Task Grouping For Multi-Task Learning

作者考虑多任务学习,同时学习相关的预测任务,以提高泛化性能。

Junyong Jeong , Chi-Hyuck Jun
Scalable Query N-Gram Embedding For Improving Matching And Relevance In Sponsored Search

作者提出了一种在赞助搜索中嵌入查询和广告的新颖方法。

Xiao Bai , Erik Ordentlich , Yuanyuan Zhang , Andy Feng , Adwait Ratnaparkhi , Reena Somvanshi , Aldi Tjahjadi
Quantifying Uncertainty In Discrete-Continuous And Skewed Data With Bayesian Deep Learning

本文研究深度学习(DL)方法。作者提出了离散连续BDL模型,其具有高斯和对数正态性的不确定性量化(UQ)。

Thomas Vandal , Evan Kodra , Jennifer Dy , Sangram Ganguly , Ramakrishna Nemani , Auroop Ganguly
DILOF: Effective And Memory Efficient Local Outlier Detection In Data Streams

本文研究异常检测算法,称为局部异常因子(LOF)。作者提出了一种新的数据流离群检测算法,称为DILOF,可有效克服LOF的局限性。

Gyoung S. Na , Donghyun Kim , Hwanjo Yu
Transfer Learning Via Feature Isomorphism Discovery

作者开发了一种新的转移学习框架,称为通过特征同构发现的转移学习(缩写为TLFid),它对域之间的嘈杂对应以及稀缺或不存在的标记实例具有高容忍性。

Shimin Di , Jingshu Peng , Yanyan Shen , Lei Chen
Visual Search At Alibaba

本文介绍了阿里巴巴的大规模视觉搜索算法和系统基础设施。(b)如何处理海量更新数据的大规模索引。

Yanhao Zhang , Pan Pan , Yun Zheng , Kang Zhao , Yingya Zhang , Xiaofeng Ren , Rong Jin
Learning To Estimate The Travel Time

车辆行驶时间估计或预计到达时间(ETA)是最重要的基于位置的服务(LBS)之一。本文提出了一种基于浮动车数据预测车辆行驶时间的新型机器学习解决方案。作者使用数百万历史车辆旅行数据离线评估该论文的解决方案。

Zheng Wang , Kun Fu , Jieping Ye
Distributed Collaborative Hashing And Its Applications In Ant Financial

本文研究了协同过滤。作者提出了分布式协作哈希(DCH)模型。

Chaochao Chen , Ziqi Liu , Peilin Zhao , Longfei Li , Jun Zhou , Xiaolong Li
Robust Bayesian Kernel Machine Via Stein Variational Gradient Descent For Big Data

大多数内核方法,包括最先进的LIBSVM,都容易受到内核化的诅咒。作者提出了一个健壮的贝叶斯内核机器(BKM) - 一个贝叶斯内核机器,它利用了贝叶斯建模和内核方法的优势。

Khanh Nguyen , Trung Le , Tu Dinh Nguyen , Dinh Phung , Geo?rey Webb
Accurate And Fast Asymmetric Locality-Sensitive Hashing Scheme For Maximum Inner Product Search

本文研究了近似最大内积(AMIP)搜索问题。作者提出了一种基于同心超球分区(H2-ALSH)的新型非对称LSH方案,用于高维AMIP搜索。

Qiang Huang , Guihong Ma , Jianlin Feng , Qiong Fang , Anthony K. H. Tung
Content To Node: Self-translation Network Embedding

本文涉及网络嵌入(NE)的问题。作者提出了一种新的基于序列到序列模型的NE框架,称为自翻译网络嵌入(STNE)模型。

Jie Liu , Zhicheng He , Lai Wei , Yalou Huang
When Sentiment Analysis Meets Social Network: A Holistic User Behavior Modeling In Opinionated Data

本文研究用户建模。

Lin Gong , Hongning Wang
Discovering Latent Patterns Of Urban Cultural Interactions In WeChat For Modern City Planning

本文研究了城市地区文化机构和相关资源的优化配置。作者利用在线社交网络微信用户位置登记的大型纵向数据集,为北京市的文化规划开发数据驱动框架。

Xiao Zhou , Anastasios Noulas , Cecilia Mascolo , Zhongxiang Zhao
Self-Paced Network Embedding

作者提出了一种新颖的自定网络嵌入方法。

Hongchang Gao , Heng Huang
Semi-Supervised Generative Adversarial Network For Gene Expression Inference

本文的职责基因表达。为了利用廉价的未标记数据,作者提出了一种用于靶基因表达推断的新型半监督深度生成模型。

Kamran Ghasedi , Xiaoqian Wang , Heng Huang
Lessons Learned From Developing And Deploying A Large-Scale Employer Name Normalization System For O

本文研究雇主姓名规范化,或将招聘职位或简历中的雇主姓名与雇主知识库(KB)中的实体联系起来。作者描述了CareerBuilder开发的CompanyDepot系统

Qiaoling Liu , Josh Chao , Thomas Mahoney , Chris Min , Faizan Javed , Alan Chern , Valentin Jijkoun
Multimodal Sentiment Analysis To Explore The Structure Of Emotions

作者提出了一种利用结合视觉分析和自然语言处理的深度神经网络进行多模态情感分析的新方法。

Anthony Hu , Seth Flaxman
Are Your Data Gathered?

本文研究了解数据分布的问题。作者提出了单峰的折叠试验。

Alban Siffer , Pierre-Alain Fouque , Alexandre Termier , Christine Largou
Improving Box Office Result Predictions For Movies Using Consumer-Centric Models

本文研究电影票房收入。作者在预测收入的系统中使用个人推荐和基于用户的预测模型,并为行业专业人士提供可操作的见解。

Rui Paulo Ruhrlander, Martin Boissier, Matthias Uflacker
On The Generative Discovery Of Structured Medical Knowledge

作者介绍了生成视角来研究关系医学实体对发现问题。提出了一种名为条件关系变分自动编码器的生成模型,通过纯粹学习现有关系医学实体对中的表达多样性,发现有意义的新型医学实体对。

Chenwei Zhang , Yaliang Li , Nan Du , Wei Fan , Philip S. Yu
Dynamic Pricing Under Competition On Online Marketplaces: A Data-Driven Approach

作者分析了具有多个报价维度的竞争市场中的随机动态定价模型,例如价格,质量和评级。

Rainer Schlosser , Martin Boissier
Pangloss: Fast Entity Linking In Noisy Text Environments

本文研究了实体链接。本文介绍了Pangloss,一种用于对噪声文本进行实体歧义消除的生产系统。

Michael Conover , Scott Blackburn , Matthew Hayes , Pete Skomoroch , Sam Shah
Towards Knowledge Discovery From The Vatican Secret Archives. In Codice Ratio

在Codice Ratio中是一个研究项目,用于研究分析梵蒂冈秘密档案馆(VSA)中保存的历史文献内容的工具。在本文中,作者提出开发一个系统来支持中世纪手稿的转录。

KDonatella Firmani , Marco Maiorino , Paolo Merialdo
Active Opinion Maximization In Social Networks

该论文研究影响最大化(IM)。作者考虑了一个名为AcTive Opinion Maximization(ATOM)的问题,其目标是找到一组种子用户,以最大化在多轮活动中向目标产品传播的整体意见。

Xinyue Liu , Xiangnan Kong , Philip Yu
Hetero-ConvLSTM: A Deep Learning Approach To Traffic Accident Prediction On Heterogeneous Spatio-Tem

本文研究预测交通事故。作者使用卷积长短期记忆(ConvLSTM)神经网络模型对交通事故预测问题进行了全面研究。

Zhuoning Yuan , Xun Zhou , Tianbao Yang
Classifying And Counting With Recurrent Contexts

批量和数据流设置中的许多实际应用程序都带有数据移位,这限制了对类标签的访问。作者在不依赖类标签可用性的情况下探索了一组不同的假设。

Denis Dos Reis
Butterfly Counting In Bipartite Networks

本文考虑了二分联盟网络中计算主题的问题。主要贡献是一套随机算法,可以快速逼近图中蝴蝶的数量,并具有可证明的准确性保证。

Seyed-Vahid Sanei-Mehri , Ahmet Erdem Sariyuce , Srikanta Tirthapura
Automated Audience Segmentation Using Reputation Signals

为广告活动选择合适的受众群体是广告流程中最具挑战性,最耗时且成本最高的步骤之一。在本文中,作者研究了需求方平台(DSP)如何利用他们收集的数据(人口统计和行为)来学习有关最终用户可兑换性和广告(广告)质量的声誉信号。

Maria Daltayanni
SPARC: Self-Paced Network Representation For Few-Shot Rare Category Characterization

本文研究罕见的类别表征。

Dawei Zhou , Jingrui He , Hongxia Yang , Wei Fan
RapidScorer: Fast Tree Ensemble Evaluation By Maximizing Compactness In Data Level Parallelization

本文研究了基于回归树加性集合的相关性排序模型。作者介绍了RapidScorer,这是一个加速行业规模树集合模型评分过程的新框架。

Ting Ye , Hucheng Zhou , Will Zou , Bin Gao , Ruofei Zhang
SQR: Balancing Speed, Quality And Risk In Online Experiments

本文研究了受控实验,也称为A / B测试。作者建立了一个可以在速度,质量和风险(SQR)之间有效平衡的渐进框架。

Ya Xu , Weitao Duan , Shaochen Huang
Tax Fraud Detection For Under-reporting Declarations Using An Unsupervised Machine Learning Approach

作者提出了一种新方法,仅使用无监督学习技术检测潜在的欺诈性纳税人,并允许未来使用监督学习技术。

Daniel de Roux , Boris P
Demand-Aware Charger Planning For Electric Vehicle Sharing

作者制定了电动汽车充电器规划(EVCP)问题,尤其是EV共享问题。

Bowen Du , Yongxin Tong , Zimu Zhou , Qian Tao , Wenjun Zhou
Active Search Of Connections For Case Building And Combating Human Trafficking

作者提出了一个名为Active Search of Connections的问题,它找到了与给定潜在客户共享不同类型证据的目标实体。它们提供了RedThread,这是一种有效的解决方案,用于推断相关和相关的节点,同时结合使用。

Reihaneh Rabbany , David Bayani , Artur Dubrawski
Reinforcement Learning To Rank In E-Commerce Search Engine: Formalization, Analysis, And Application

学习排名(LTR)方法已广泛应用于排名问题。 作者建议使用强化学习(RL)来学习最佳排名策略,该策略最大化搜索会话中的预期累积奖励。

Yujing Hu , Qing Da , Anxiang Zeng , Yang Yu , Yinghui Xu
Stablizing Reinforcement Learning In Dynamic Environment With Application To Online Recommendation

传统的强化学习方法旨在在静态环境中工作。 作者提出了两种缓解动态环境中不稳定奖励估计问题的技术,分层抽样重放策略和近似后悔奖励。

Shi-Yong Chen , Yang Yu , Qing Da , Jun Tan , Hai-Kuan Huang , Hai-Hong Tang
Managing Computer-Assisted Detection System Based On Transfer Learning With Negative Transfer Inhibi

基于机器学习的计算机辅助检测(CAD)系统有望协助放射科医师。 在本文中,由于需要保护每个机构的个人信息,作者专注于转移学习而不共享培训数据。

Issei Sato , Yukihiro Nomura , Shouhei Hanaoka , Soichiro Miki , Naoto Hayashi , Osamu Abe , Yoshitaka Masutani
Hyperparameter Importance Across Datasets

本文研究了自动超参数优化方法。 作者的目的是回答以下两个问题:给定一个算法,通常最重要的超参数是什么,这些通常是什么好的值?

Jan N. van Rijn , Frank Hutter
Assessing Candidate Preference Through Web Browsing History

作者提议使用网络浏览历史作为选民中候选人偏好的新指标,有可能克服选举民意调查的一些弊端。

Giovanni Comarela
Active Deep Learning To Tune Down The Noise In Labels

作者提出了一种新的主动深度去噪(ADD)方法,该方法首先构建DNN噪声模型,然后采用主动学习算法来识别最佳去噪函数。

Karan Samel , Xu Miao
Gotcha - Sly Malware! Scorpion: A Metagraph2vec Based Malware Detection System

作者提出了一个新的HIN嵌入模型metagraph2vec,首次尝试学习HIN中节点的低维表示,其中HIN结构和语义都被最大限度地保留用于恶意软件检测

Yujie Fan , Shifu Hou , Yiming Zhang , Yanfang Ye , Melih Abdulhayoglu
Ranking and Making Recommendations
Paper Name & Summary Author(s)
Q&R: A Two-Stage Approach Toward Interactive Recommendation

本文研究推荐系统。作者详细介绍了一种基于RNN的模型,用于生成用户可能感兴趣的主题,然后扩展最先进的基于RNN的视频推荐器,以合并用户选择的主题。

Konstantina Christakopoulou , Alex Beutel , Rui Li , Sagar Jain , Ed H. Chi
Graph Convolutional Neural Networks For Web-Scale Recommender Systems

作者开发了一种数据有效的图形卷积网络(GCN)算法,该算法结合了有效的随机漫游和图形卷积,以生成包含图形结构和节点特征信息的节点(即项目)的嵌入。

Rex Ying , Ruining He , Kaifeng Chen , Pong Eksombatchai , William L. Hamilton , Jure Leskovec
Real-time Personalization Using Embeddings For Search Ranking At Airbnb

本文研究搜索排名和建议。作者描述了我们为搜索排名和类似列表建议中的实时个性化而开发和部署的列表和用户嵌入技术

Mihajlo Grbovic , Haibin Cheng
Online Parameter Selection For Web-based Ranking Problems

本文研究基于Web的排名问题。作者考虑了一种大规模的在线应用程序,其中多个目标的度量是连续可用的,并且可以通过改变排序模型中的某些控制参数以期望的方式来控制。

Deepak Agarwal , Kinjal Basu , Souvik Ghosh , Ying Xuan , Yang Yang , Liang Zhang
Near Real-time Optimization Of Activity-based Notifications

本文研究了社交媒体的通知问题。

Yan Gao , Viral Gupta , Jinyun Yan , Changji Shi , Zhongen Tao , Pj Xiao , Curtis Wang , Shipeng Yu , Romer Rosales , Ajith Muralidharan , Shaunak Chatterjee
Recommenders I
Paper Name & Summary Author(s)
Ranking Distillation: Learning Compact Ranking Models With High Performance For Recommender System

作者提出了一种新的方法来训练有效和高效的排名模型,例如推荐系统。他们提出了一种用于学习排序问题的KD技术,称为排序蒸馏(RD)。

Jiaxi Tang , Ke Wang
Efficient Attribute Recommendation With Probabilistic Guarantee

作者研究如何有效地解决原始数据探索问题:给定两个定义关系表的两个子集的ad-hoc谓词,找到两个子集中的分布彼此偏离最多的前K个属性。作者开发了一种自适应查询解决方案,具有正确性和近似最优样本复杂度的概率保证。

Chi Wang , Kaushik Chakrabarti
Algorithms For Hiring And Outsourcing In The Online Labor Market

在本文中,作者提供了在一般环境中外包和雇用工人的算法,其中工人组成团队并提供不同的技能来执行任务。他们将此模型团队称为外包。

Aris Anagnostopoulos , Carlos Castillo , Adriano Fazzone , Stefano Leonardi , Evimaria Terzi
Multi-Pointer Co-Attention Networks For Recommendation

许多最新的最先进的推荐系统,如D-ATT,TransNet和DeepCoNN,利用对表示学习的评论。本文提出了一种新的神经架构,用于推荐和评论。

Yi Tay , Anh Tuan Luu , Siu Cheung Hui
Leveraging Meta-path Based Context For Top N Recommendation With Co-attention Mechanism

本文研究了异构信息网络(HIN)。为了构建基于元路径的上下文,作者提出使用基于优先级的抽样技术来选择高质量的路径实例。

Binbin Hu , Chuan Shi , Xin Zhao , Philip S. Yu
Recommenders II
Paper Name & Summary Author(s)
XDeepFM: Combining Explicit And Implicit Feature Interactions For Recommender Systems

本文研究了组合特征。作者提出了一种新颖的压缩交互网络(CIN),旨在以明确的方式和向量级别生成特征交互。

Jianxun Lian , Xiaohuan Zhou , Fuzheng Zhang , Zhongxia Chen , Xing Xie , Guangzhong Sun
STAMP: Short-Term Attention/Memory Priority Model For Session-based Recommendation

本文研究基于匿名会话预测用户的行为。提出了一种新颖的短期注意/记忆优先模型作为补救措施,它能够从会话环境的长期记忆中捕获用户的一般兴趣,

Qiao Liu , Yifu Zeng , Refuoe Mokhosi , Haibin Zhang
Local Latent Space Models For Top-N Recommendation

本文研究用户的行为。作者考虑了一些模型,其中存在捕获共享方面的一些潜在因素和一些用户子集特定的潜在因素,这些因素捕获了不同用户子集关心的方面集。

Evangelia Christakopoulou , George Karypis
Multi-User Mobile Sequential Recommendation: An Efficient Parallel Computing Paradigm

本文研究了经典的移动顺序推荐(MSR)问题。作者正式确定了一个新的多用户MSR(MMSR)问题,该问题为具有不同起始位置的一组驾驶员定位最佳路线。

Zeyang Ye , Lihao Zhang , Keli Xiao , Wenjun Zhou , Yong Ge , Yuefan Deng
Trajectory-driven Influential Billboard Placement

在本文中,作者提出并研究了轨迹驱动的有影响力的广告牌布局问题。

Ping Zhang , Zhifeng Bao , Yuchen Li , Guoliang Li , Yipeng Zhang , Zhiyong Peng
Offline Evaluation Of Ranking Policies With Click Models

许多网络系统为用户排列并显示项目列表。实践中的一个重要问题是离线评估新的排名策略并在部署之前对其进行优化。作者提出了用于估计历史记录数据中排名列表的预期点击次数的评估算法。

Shuai Li , Yasin Abbasi-Yadkori , Branislav Kveton , S. Muthukrishnan , Vishwa Vinay , Zheng Wen
Reinforcement Learning
Paper Name & Summary Author(s)
IntelliLight: A Reinforcement Learning Approach For Intelligent Traffic Light Control

本文研究智能交通灯控制。在本文中,作者提出了一种更有效的交通灯控制深度强化学习模型。

Hua Wei , Guanjie Zheng , Huaxiu Yao , Zhenhui Li
Transcribing Content From Structural Images With Spotlight Mechanism

本文研究了从结构图像中转录内容的问题。作者提出了一个分层的Spotlight转录网络(STN)框架,然后是一个两阶段的“从哪里来”的解决方案。作者还设计了一种强化方法,通过自我改进聚光机制来改进论文的STN框架。

Yu Yin , Zhenya Huang , Enhong Chen , Qi Liu , Fuzheng Zhang , Xing Xie , Guoping Hu
Investor-Imitator: A Framework For Trading Knowledge Extraction

本文研究股票交易的分析。作者提出了一个强化学习驱动的投资者 - 模仿者框架,通过用一组逻辑描述符模仿投资者的行为来形式化交易知识。

Yi Ding , Weiqing Liu , Jiang Bian , Daoqiang Zhang , Tie-Yan Liu
Efficient Large-Scale Fleet Management Via Multi-Agent Deep Reinforcement Learning

本文研究大规模车队管理策略。作者提出利用强化学习解决大规模车队管理问题,并提出一个包含两个具体算法的情境多智能强化学习框架,即语境深度Q学习和上下文多代理行为者 - 批评者,以实现适应不同上下文的大量代理之间的显式协调。

Kaixiang Lin , Renyu Zhao , Zhe Xu , Jiayu Zhou
Supervised Reinforcement Learning With Recurrent Neural Network For Dynamic Treatment Recommendation

本文研究基于大规模电子健康记录(EHR)的动态治疗推荐系统。作者提出了使用递归神经网络(SRL-RNN)的监督强化学习,它将它们融合到一个协同学习框架中。

Lu Wang , Wei Zhang , Xiaofeng He , Hongyuan Zha
Representation and Embedding I
Paper Name & Summary Author(s)
Multi-label Learning With Highly Incomplete Data Via Collaborative Embedding

本文研究提高不完全标签分配的多标签学习的有效性。作者提出了一种基于协作嵌入思想的弱监督多标签学习方法。

Yufei Han , Yun Shen , Guolei Sun , Xiangliang Zhang
Concepts-Bridges: Uncovering Conceptual Bridges Based On Biomedical Concept Evolution

给出两个感兴趣的主题(A,C),否则它们会断开,例如两个概念:一种疾病(“偏头痛”)和一种治疗物质(“镁”),本文试图找到概念桥(例如,血清素( B)以新颖的方式连接它们。作者将此问题定义为挖掘时间感知的Top-k概念桥,并且这样做提供了一种系统化方法来形式化问题。

Kishlay Jha , Guangxu Xun , Yaqing Wang , Vishrawas Gopalakrishnan , Aidong Zhang
Interactive Paths Embedding For Semantic Proximity Search On Heterogeneous Graphs

本文研究了异构图上的语义邻近搜索。作者介绍了一种新颖的交互式路径概念,用于模拟查询对象和目标对象之间多条路径之间的相互依赖关系。然后,他们提出交互式路径嵌入(IPE)模型,该模型学习用于邻近估计的所得交互路径结构的低维表示。

Zemin Liu , Vincent W. Zheng , Zhou Zhao , Zhao Li , Hongxia Yang , Minghui Wu , Jing Ying
Multi-Type Itemset Embedding For Learning Behavior Success

上下文行为建模使用来自多个上下文的数据来发现预测分析的模式。作者将行为表示为一组不同类型的上下文项(例如决策者,运算符,目标和资源),将可观察项集视为行为成功,并提出一种新颖的可扩展方法,“多类型项集嵌入” ,学习保留成功结构的上下文项表示。

Daheng Wang , Meng Jiang , Qingkai Zeng , Zachary Eberhart , Nitesh Chawla
Learning Representations Of Ultrahigh-dimensional Data For Random Distance-based Outlier Detection

本文研究了学习超高维数据表达低维表示的问题。

Guansong Pang , Longbing Cao , Ling Chen , Huan Liu
Representation and Embedding II
Paper Name & Summary Author(s)
Deep Recursive Network Embedding With Regular Equivalence

本文研究网络嵌入。作者提出了一种名为深度递归网络嵌入(DRNE)的新方法,以学习具有规则等价性的网络嵌入。

Ke Tu , Peng Cui , Xiao Wang , Philip S. Yu , Wenwu Zhu
Arbitrary-Order Proximity Preserved Network Embedding

本文研究网络嵌入。作者提出了一种基于SVD框架的新型网络嵌入方法AROPE(任意阶接近保留嵌入)。

Ziwei Zhang , Peng Cui , Xiao Wang , Jian Pei , Xuanrong Yao , Wenwu Zhu
NetWalk: A Flexible Deep Embedding Approach For Anomaly Detection In Dynamic Networks

本文研究了大规模和动态网络。作者提出了一种新方法NetWalk,通过学习网络表示在动态网络中进行异常检测,网络表示可以随着网络的发展而动态更新。

Wenchao Yu , Wei Cheng , Charu Aggarwal , Kai Zhang , Haifeng Chen , Wei Wang
Embedding Temporal Network Via Neighborhood Formation

本文研究网络嵌入。作者介绍了邻域形成序列的概念来描述节点的演化,其中序列中的邻居之间存在时间激励效应,并提出基于霍克斯过程的时间网络嵌入(HTNE)方法。

Yuan Zuo , Guannan Liu , Hao Lin , Jia Guo , Xiaoqian Hu , Junjie Wu
Finding Similar Exercises With A Unified Semantic Representation

本文研究了在线教育系统中寻找类似练习的问题。作者开发了一种新的基于多模态注意的神经网络(MANN)框架,通过从异构数据中学习统一的语义表示,在大规模在线教育系统中寻找类似的练习。

Qi Liu , Zai Huang , Zhenya Huang , Chuanren Liu , Enhong Chen , Yu Su , Guoping Hu
Hierarchical Taxonomy Aware Network Embedding

本文研究网络嵌入。将分层分类法纳入网络嵌入是一项巨大的挑战。作者提出了NetHiex,一种捕获潜在的HIErarchical taXonomy的NETwork嵌入模型。整个模型在非参数概率框架内统一。

Jianxin Ma , Peng Cui , Xiao Wang , Wenwu Zhu
Safety
Paper Name & Summary Author(s)
A Dynamic Pipeline For Spatio-Temporal Fire Risk Prediction

世界各城市近期备受瞩目的火灾事件凸显了减少火灾风险工作的空白。作者根据各市政机构的时变数据,为匹兹堡的所有20,636个商业地产开发了预测风险框架。

Bhavkaran Singh Walia , Qianyi Hu , Jeffrey Chen , Fangyan Chen , Jessica Lee , Nathan Kuo , Palak Narang , Jason Batts , Geoffrey Arnold , Michael Madaio
Detecting Spacecraft Anomalies Using LSTMs And Nonparametric Dynamic Thresholding

本文研究航天器监测系统。作者证明了长期短期记忆(LSTM)网络的有效性,这是一种回归神经网络(RNN),它使用来自土壤湿度主动被动(SMAP)卫星和火星科学实验室的专家标记的遥测异常数据( MSL)流浪者,好奇心。

Kyle Hundman , Valentino Constantinou , Christopher Laporte , Ian Colwell , Tom Soderstrom
ActiveRemediation: The Search For Lead Pipes In Flint, Michigan

作者详细介绍了他们在密歇根州弗林特市进行的用于检测铅和其他有害金属管道的工作。

Jacob Abernethy , Alex Chojnacki , Arya Farahi , Eric Schwartz , Jared Webb
Explaining Aviation Safety Incidents Using Deep Temporal Multiple Instance Learning

本文涉及航空安全。作者提出了一种前驱挖掘算法,该算法识别与安全事件相关的多维时间序列中的事件。

Vijay Manikandan Janakiraman
Semi-supervised and Transfer Learning
Paper Name & Summary Author(s)
Learning Dynamics Of Decision Boundaries Without Additional Labeled Data

作者提出了一种学习决策边界动态的方法,以保持分类性能而无需额外的标记数据。

Atsutoshi Kumagai , Tomoharu Iwata
Towards Mitigating The Class-Imbalance Problem For Partial Label Learning

本文研究部分标签(PL)学习。为了减轻类不平衡对部分标签学习的负面影响,通过采用过采样技术处理PL训练样例,提出了一种新的类不平衡感知方法CIMAP。

Jing Wang , Min-Ling Zhang
Learning Adversarial Networks For Semi-Supervised Text Classification Via Policy Gradient

本文研究半监督学习。作者将半监督学习重新定义为基于模型的强化学习问题,并提出了基于对抗网络的框架。作者提出了一种基于递归神经网络的半监督文本分类模型。

Yan Li , Jieping Ye
Scalable Active Learning By Approximated Error Reduction

本文研究了大规模数据集上多类分类的主动学习问题。本文提出了一种新的查询选择标准,称为近似误差减少(AER)。

Weijie Fu , Meng Wang , Shijie Hao , Xindong Wu
Multi-view Adversarially Learned Inference For Cross-domain Joint Distribution Matching

许多重要的数据挖掘问题可以建模为学习两个数据域之间的(双向)多维映射。作者提出了一种多视图对侧学习推理(ALI)模型,称为MALI。

Changying Du , Changde Du , Xingyu Xie , Chen Zhang , Hao Wang
Supervised Learning I
Paper Name & Summary Author(s)
Feedback-Guided Anomaly Discovery Via Online Optimization

本文是关于异常探测器的。在本文中,作者研究了如何通过结合他们关于他们调查的异常是否有意义的反馈来减少分析师的努力。

Md Amran Siddiqui , Alan Fern , Thomas Dietterich , Ryan Wright , Alec Theriault , David Archer
Modeling Task Relationships In Multi-task Learning With Multi-gate Mixture-of-Experts

在这项工作中,作者提出了一种新的多任务学习方法,即多门混合专家(MMoE),它明确地学习从数据建模任务关系。

Jiaqi Ma , Zhe Zhao , Xinyang Yi , Jilin Chen , Lichan Hong , Ed Chi
Unlearn What You Have Learned: Adaptive Crowd Teaching With Exponentially Decayed Memory Learners

在本文中,作者解决了自适应人群教学的一个不同问题,这是众包背景下机器教学的一个子领域。他们提出了一个名为JEDI的自适应教学框架,为众包工人构建个性化的最优教学模块。

Yao Zhou , Arun Reddy Nelakurthi , Jingrui He
Complex Object Classification: A Multi-Modal Multi-Instance Multi-Label Deep Network With Optimal Tr

本文研究了多种模态表示。作者提出了一种新颖的多模多实例多标签深度网络(M3DN),它可以学习标签预测并基于最佳传输同时利用标签相关性,

Yang Yang , Yi-Feng Wu , De-Chuan Zhan , Zhi-Bin Liu , Yuan Jiang
Calibrated Multi-Task Learning

本文提出了一种新的算法,名为Non-Convex Calibrated Multi-Task Learning(NC-CMTL),用于联合学习多个相关的回归任务。

Feiping Nie , Zhanxuan Hu , Xuelong Li
Supervised Learning II
Paper Name & Summary Author(s)
Adversarial Detection With Model Interpretation

作者建议调查模型解释是否可能有助于对抗性检测。

Ninghao Liu , Hongxia Yang , Xia Hu
Training Big Random Forests With Little Resources

本文研究了在大型数据集上构建随机森林的问题。作者提出了一个简单而有效的框架,允许使用具有商品硬件的廉价台式计算机有效地为数亿甚至数十亿的训练实例构建大树的集合体。

Fabian Gieseke , Christian Igel
Stable Prediction Across Unknown Environments

在许多重要的机器学习应用中,用于学习概率分类器的训练分布不同于分类器用于进行预测的分布。作者提出了一种新颖的深度全局平衡回归(DGBR)算法,以联合优化用于特征选择的深度自动编码器模型和用于在未知环境中进行稳定预测的全局平衡模型。

Kun Kuang , Peng Cui , Susan Athey , Ruoxuan Xiong , Bo Li
R2SDH: Robust Rotated Supervised Discrete Hashing

本文研究基于学习的哈希算法。在本文中,作者提出了一种基于学习的哈希算法,称为“鲁棒旋转监督离散哈希”(R 2 SDH),通过扩展先前关于“监督离散哈希”(SDH)的工作。

Jie Gui , Ping Li
A Treatment Engine By Predicting Next-Period Prescriptions

本文研究电子病历(EMRs)。本文旨在开发一种治疗引擎,该治疗引擎从历史EMR数据中学习,并根据患者的疾病状况,实验室结果和治疗记录为患者提供下一期处方。

Bo Jin , Haoyu Yang , Leilei Sun , Chuanren Liu , Yue Qu , Jianing Tong
Risk Prediction On Electronic Healthcare Records With Prior Medical Knowledge

本文研究从电子健康记录(EHR)预测潜在疾病的风险。作者提出了一种新的通用框架,称为PRIME,用于风险预测任务,可以使用后验正则化技术成功地将离散的先验医学知识纳入所有最先进的预测模型。

Fenglong Ma , Jing Gao , Qiuling Suo , Quanzeng You , Jing Zhou , Aidong Zhang
Temporal and Spatial Data Mining I
Paper Name & Summary Author(s)
You Are How You Drive: Peer And Temporal-Aware Representation Learning For Driving Behavior Analysis

本文研究了驾驶行为分析的问题。作者开发了基于Peer和Temporal-Aware表示学习的框架(PTARL),用于利用GPS轨迹数据进行驾驶行为分析。

Pengyang Wang , Yanjie Fu , Jiawei Zhang , Pengfei Wang , Yu Zheng , Charu Aggarwal
Decoupled Learning For Factorial Marked Temporal Point Processes

本文提出了一个因子标记的时间点过程模型,并提出了有效的学习方法。

Weichang Wu , Junchi Yan , Xiaokang Yang , Hongyuan Zha
A Dual Markov Chain Topic Model For Dynamic Environments

丰富的数字文本引发了对主题模型的广泛研究,这些主题模型推理使用潜在表示的文档。本文介绍了DM-DTM,一种双马尔可夫链动态主题模型,用于表征随时间演变的语料库。

Ayan Acharya , Joydeep Ghosh , Mingyuan Zhou
StockAssIstant: A Stock AI Assistant For Reliability Modeling Of Stock Comments

本文研究了分析师的股票评论。本文提供了一种名为StockAssIstant的解决方案,通过考虑多种因素对股票评论的可靠性进行建模。

Chen Zhang , Hao Wang , Changying Du , Yijun Wang , Can Chen , Hongzhi Yin
Exploring The Urban Region-of-Interest Through The Analysis Of Online Map Search Queries

本文研究了城市感兴趣区域(ROI)。 作者通过挖掘大规模在线地图查询日志提出了ROI分析的系统研究,该日志为ROI检测和分析提供了新的数据驱动研究范例。

Ying Sun , Hengshu Zhu , Fuzhen Zhuang , Jingjing Gu , Qing He
Temporal and Spatial Data Mining II
Paper Name & Summary Author(s)
Geographical Hidden Markov Tree For Flood Extent Mapping

本文研究洪水范围映射。作者提出了地理隐马尔可夫树,这是一种概率图形模型,它将常见的隐马尔可夫模型从一维序列推广到二维图。

Miao Xie , Zhe Jiang , Arpan Man Sainju
REST: A Reference-based Framework For Spatio-temporal Trajectory Compression

为了解决由于类似于给定轨迹而存在的大量参考轨迹组合所引起的计算问题,作者提出了在眨眼间运行的高效贪婪算法和可以实现最佳压缩的动态编程算法比。

Yan Zhao , Shuo Shang , Yu Wang , Bolong Zheng , Quoc Viet Hung Nguyen , Kai Zheng
Efficient Similar Region Search With Deep Metric Learning

作者研究了在给定用户指定的查询区域的情况下搜索相似区域的问题。他们提出了一种新颖的解决方案,其中包括:(1)深度学习方法,用于学习考虑对象属性和对象之间相对位置的相似性; (2)一种有效的分支定界搜索算法,用于寻找前N个相似区域。

Yiding Liu , Kaiqi Zhao , Gao Cong
Dynamic Bike Reposition: A Spatio-Temporal Reinforcement Learning Approach

本文研究了自行车共享系统。作者提出了一种基于时空强化学习的自行车复位模型来解决这个问题。

Yexin Li , Yu Zheng , Qiang Yang
Simultaneous Urban Region Function Discovery And Popularity Estimation Via An Infinite Urbanization

作者提出了城市区域功能同时发现和区域流行度预测的无限城市化过程(IUP)模型。

Bang Zhang , Lelin Zhang , Ting Guo , Yang Wang , Fang Chen
Texts, Images and Videos
Paper Name & Summary Author(s)
Collaborative Deep Metric Learning For Video Understanding

视频理解的目标是开发算法,使机器能够理解人类专家级别的视频。作者提出了一个深度网络,将使用其视听内容的视频嵌入到保留视频到视频关系的度量空间中。

Joonseok Lee , Sami Abu-El-Haija , Balakrishnan Varadarajan , Paul Natsev
Corpus Conversion Service: A Machine Learning Platform To Ingest Documents At Scale.

作者提出了一个基于云的模块化平台,可以大规模地提取文档。

Peter W J Staar , Michele Dolfi , Christoph Auer , Costas Bekas
Rosetta: Large Scale System For Text Detection And Recognition In Images

在本文中,作者提出了一个部署的,可扩展的光学字符识别(OCR)系统,作者称之为Rosetta,旨在处理每日上传的Facebook图像。

Fedor Borisyuk , Albert Gordo , Viswanath Sivakumar
Rare Query Expansion Through Generative Adversarial Networks In Search Advertising

作者探索使用GAN直接从赞助搜索广告选择中的查询生成出价关键字,尤其是对于罕见的查询。

Mu-Chu Lee , Bin Gao , Ruofei Zhang
Name Disambiguation In AMiner: Clustering, Maintenance, And Human In The Loop

AMiner是一个免费的在线学术搜索和挖掘系统,已从多个出版物数据库收集了超过130,000,000个研究人员简介和超过200,000,000篇论文。

Yutao Zhang , Fanjin Zhang , Peiran Yao , Jie Tang
Unsupervised Learning I
Paper Name & Summary Author(s)
TruePIE: Discovering Reliable Patterns In Pattern-Based Information Extraction

本文研究基于模式的方法。作者提出了一种名为TruePIE的新方法,该方法可以找到可靠的模式,不仅可以提取相关信息,还可以提取正确的信息。

Qi Li , Meng Jiang , Xikun Zhang , Meng Qu , Timothy Hanratty , Jing Gao , Jiawei Han
TaxoGen: Constructing Topical Concept Taxonomy By Adaptive Term Embedding And Clustering

本文研究分类学的构建。作者提出了一种构建主题分类法的方法,其中每个节点代表一个概念主题,并被定义为一组语义连贯的概念术语。

Chao Zhang , Fangbo Tao , Xiusi Chen , Jiaming Shen , Meng Jiang , Brian Sadler , Michelle Vanni , Jiawei Han
Scalable K-Means Clustering Via Lightweight Coresets

Coresets是数据集的紧凑表示,因此在核心集上训练的模型与在完整数据集上训练的模型相比具有可比性。作者提供了一种算法来构建用于k -means聚类的轻量级核心集以及软和硬Bregman聚类。

Olivier Bachem , Mario Lucic , Andreas Krause
Discovering Non-Redundant K-means Clusterings In Optimal Subspaces

本文研究非冗余聚类。作者表明,非冗余的k-means-like聚类可能存在于高维空间的不同的,任意定向的子空间中。

Dominik Mautz , Wei Ye , Claudia Plant , Christian B
TextTruth: An Unsupervised Approach To Discover Trustworthy Information From Multi-Sourced Text Data

作者提出了一种名为“TextTruth”的新型真值发现方法,它将从特定问题的答案中提取的关键词组合成多个可解释的因子,并推断出答案因素和答案提供者的可信度。

Hengtong Zhang , Yaliang Li , Fenglong Ma , Jing Gao , Lu Su
Unsupervised Learning II
Paper Name & Summary Author(s)
Scalable Spectral Clustering Using Random Binning Features

本文研究光谱聚类。在本文中,作者提出了一种新的可扩展谱聚类方法,使用随机Binning特征(RB)同时加速相似图构造和特征分解。

Lingfei Wu , Pin-Yu Chen , Ian En-Hsu Yen , Fangli Xu , Yinglong Xia , Charu Aggarwal
Model-based Clustering Of Short Text Streams

本文研究短文本流聚类。在本文中,作者提出了一种基于模型的短文本流聚类算法(MStream),它可以自然地处理概念漂移问题和稀疏性问题。

Jianhua Yin , Daren Chao , Zhongkun Liu , Wei Zhang , Xiaohui Yu , Jianyong Wang
MiSoSouP: Mining Interesting Subgroups With Sampling And Pseudodimension

作者提供MiSoSouP,这是一套算法,用于根据交易数据集的随机样本,根据不同的兴趣度量来提取最有趣的子群的高质量近似值。

Matteo Riondato , Fabio Vandin
Spectral Clustering Of Large-scale Data By Directly Solving Normalized Cut

本文研究了谱聚类算法。作者提出了一种新的优化算法,即直接归一化切割(DNC),以直接优化归一化切割模型。

Xiaojun Chen , Weijun Hong , Feiping Nie , Dan He , Min Yang , Joshua Z. Huang
Multiview Clustering Via Adaptively Weighted Procrustes

在本文中,作者对单视图谱聚类研究中提出的光谱旋转技术进行了多视图扩展。除此之外,作者提出了一种克服上述缺陷的自适应加权Procrustes(AWP)方法。

Feiping Nie , Lai Tian , Xuelong Li
Urban Planning
Paper Name & Summary Author(s)
Where Will Dockless Shared Bikes Be Stacked?—- Parking Hotspots Detection In A New City

本文研究了在没有无码头共用自行车的新城市中检测停车热点的问题。作者从多源城市数据中提取了有用的特征,并引入了一个新的域自适应网络,用于传递从一个城市学到的热点知识与共享自行车到一个新的城市。

Zhaoyang Liu , Yanyan Shen , Yanmin Zhu
Towards Station-level Demand Prediction For Effective Rebalancing In Bike-sharing Systems

本文研究自行车共享系统。作者专注于预测系统每个站点的需求租金和回报的每小时需求。

Pierre Hulot , Daniel Aloise , Sanjay Jena
Du-Parking: Spatio-Temporal Big Data Tells You Realtime Parking Availability

本文研究实时停车可用性信息。作者提出了一种基于深度学习的方法,称为Du-Parking,它由三个主要部分组成,分别对时间亲近度,周期和当前一般影响进行建模。

Yuecheng Rong , Zhimian Xu , Ruibo Yan , Xu Ma
Detecting Illegal Vehicle Parking Events Using Sharing Bikes’ Trajectories

本文研究非法车辆停放。作者设计了一个无处不在的非法停车检测系统。

Tianfu He , Jie Bao , Ruiyuan Li , Sijie Ruan , Yanhua Li , Chao Tian , Yu Zheng
WattHome: Identifying Energy-Inefficient Homes At City-scale

作者介绍了目前的WattHome,这是一种数据驱动方法,用于识别城市或地区大量建筑物中节能效率最低的建筑物。

Srinivasan Iyengar , Stephen Lee , David Irwin , Prashant Shenoy , Benjamin Weil