由组织结构、h合著和引用产生的研究网络:德国综合生物多样性研究中心 (iDiv) 的案例研究;GitHub 协作网络上的社区形成和检测;抗议期间语言行为的纵向变化:乌克兰 Euromaidan 的案例研究;具有跟踪可行性保证的社会图的贝叶斯推理;离散双曲随机图模型;使用上下文和语义关系的基于图的统一虚假信息检测方法;知识图嵌入如何外推到看不见的数据:语义证据视图;由组织结构、h合著和引用产生的研究网络:德国综合生物多样性研究中心 (iDiv) 的案例研究原文标题: Research networks generated by organizational structures, co-authorships and citations: A Case Study of German Centre for Integrative Biodiversity Research (iDiv)地址: http://arxiv.org/abs/2103.11911作者: Zhao Qu摘要: 探索不同的模式是否出现在由组织结构、合着和引用产生的网络中,以表征和评估合作关系对于将研究成果转化为实践尤为重要。这篇正在进行的研究论文侧重于利用科学合作的结构和映射知识转移来深入理解与德国研究基金会 (DFG) 资助相关的合作研究中心的影响。在德国综合生物多样性研究中心 (iDiv) 内,DFG 赞助了一百多个研究小组在所有参与的大学和研究所进行的研究,这些小组将他们的专业知识带到了生物多样性的多个研究领域。使用 2013 年至 2020 年的 iDiv 研究,我们建立了合著者网络并确定了协作方面最具凝聚力的社区,并将其与其网站上展示的群体进行了比较。相应的被引和引用作品按分布进行分析,以调查学科合作。我们的研究结果表明,论文数量和研究合作强度保持稳定增长。尽管 iDiv 解决了高度凝聚的合作结构,但与其在国际合作中不断增长的趋势相比,内部科学合作并没有获得强劲的动力。覆盖跨学科研究焦点的趋势并不明显。GitHub 协作网络上的社区形成和检测原文标题: Community Formation and Detection on GitHub Collaboration Networks地址: http://arxiv.org/abs/2109.11587作者: Behnaz Moradi-Jamei, Brandon L. Kramer, J. Bayoan Santiago Calderon, Gizem Korkmaz摘要: 本文研究了 OSS 协作网络中的社区形成。虽然当前的大多数工作都在研究小型 OSS 项目的出现,但我们的方法利用了 180 万 GitHub 用户及其存储库贡献的大规模历史数据集。 OSS 协作的特点是小群用户紧密合作,从而导致存在由底层网络结构中的短周期定义的社区。为了理解这种现象的影响,我们在实施 Louvain 方法来识别网络中的社区之前,通过使用更新-非回溯随机游走 (RNBRW) 和成对协作的强度应用了一个预处理步骤,该步骤解释了循环网络结构。为 Louvain 配备 RNBRW 和贡献强度,为检测小规模团队提供了一种更加自信的方法,并揭示了社区检测中的重要差异,例如用户倾向于优先依附于更成熟的协作社区。使用这种方法,我们还确定了影响社区形成的关键因素,包括用户位置和主要编程语言的影响,这是使用贡献活动的比较方法确定的。总体而言,本文为开源软件专家和对研究团队组建感兴趣的网络学者提供了一些有前景的方法论见解。抗议期间语言行为的纵向变化:乌克兰 Euromaidan 的案例研究原文标题: Longitudinal change in language behaviour during protests: A case study of Euromaidan in Ukraine地址: http://arxiv.org/abs/2109.11623作者: Ivan Slobozhan, Tymofii Brik, Rajesh Sharma摘要: 在过去十年中,在线社交媒体已成为抗议者在世界各地组织和表达其议程的主要平台。尽管如此,学者们仍在争论在线工具是否会引发或促进线下抗议。不幸的是,对抗议的研究通常缺乏面板数据,无法解决特定用户如何根据抗议议程随时间改变他们的行为。为此,我们分析了 Facebook 页面 EuroMaydan 的一个新数据集,该页面是为促进 2013 年 11 月至 2014 年 2 月在乌克兰举行的抗议活动而明确创建的。此外,我们的分析甚至在抗议结束后一直持续到 2014 年 6 月。该数据集总共包括 26,631 个帖子和 1,470,593 条评论,这些评论由 124,790 名用户在抗议期间和之后生成。我们使用此面板数据来测试特定用户如何在此页面的两种最流行语言之间切换:乌克兰语和俄语。先前的研究对乌克兰抗议期间的语言行为感到困惑。尽管由于全国动员,研究人员预计会看到更多的乌克兰语,但研究发现,乌克兰抗议者经常使用俄语,尤其是在抗议结束后。有人提出一种假设,即抗议者根据情况(例如,最大限度地扩大外展)有策略地使用语言。然而,以前的研究依赖于汇总数据,并没有探索语言行为的内部变异。我们的研究通过添加对语言行为的纵向分析来增加这项奖学金。考虑到本文的更广泛贡献,我们通过验证从调查中得出的先前发现,即激进主义者改变他们的行为以反映先前的偏好和情境目标,而不是修改他们的偏好,从而增加了有关抗议的文献。具有跟踪可行性保证的社会图的贝叶斯推理原文标题: Bayesian Inference of a Social Graph with Trace Feasibility Guarantees地址: http://arxiv.org/abs/2109.11642作者: Effrosyni Papanastasiou, Anastasios Giovanidis摘要: 网络推理是决定节点之间的一组交互背后的真正未知图是什么的过程。关于该主题有大量文献,但大多数已知方法都有一个重要缺点:推断图不能保证解释输入轨迹中的每个交互。我们认为这是一个重要问题,因为这种推断图不能用作需要对真实图进行可靠估计的应用程序的输入。另一方面,具有跟踪可行性保证的图可以帮助我们更好地理解感兴趣的节点之间可能发生的真实(隐藏)交互。这种图的推理是本文的目标。首先,给定来自社会网络的活动日志,我们引入了一组约束,考虑到跟踪节点之间可能的所有隐藏路径,给定它们的交互时间戳。然后,我们开发了 Newman [1] 对期望最大化算法的重要修改,我们称之为 Constrained-EM,它将约束和一组辅助变量合并到推理过程中,以引导其实现跟踪的可行性。来自 Twitter 的真实世界数据的实验结果证实,Constrained-EM 生成了图的后验分布,该分布解释了跟踪中观察到的所有事件,同时呈现了无标度、小世界图的所需属性。我们的方法在推断图的可行性和质量方面也优于既定方法。离散双曲随机图模型原文标题: Discrete Hyperbolic Random Graph Model地址: http://arxiv.org/abs/2109.11772作者: Dorota Celińska-Kopczyńska, Eryk Kopczyński摘要: 双曲随机图模型 (HRG) 已被证明可用于无标度网络的分析,无标度网络在许多领域中无处不在,从社会网络分析到生物学。但是,由于双曲平面中距离的性质,使用此模型在算法和概念上都具有挑战性。在本文中,我们提出了 HRG 模型的离散变体,其中节点映射到三角剖分的顶点;我们的算法允许我们以一种简单而有效的方式使用这个模型。我们展示了在真实世界和模拟网络上进行的实验结果,以评估 DHRG 与 HRG 模型相比的实际优势。使用上下文和语义关系的基于图的统一虚假信息检测方法原文标题: A Unified Graph-Based Approach to Disinformation Detection using Contextual and Semantic Relations地址: http://arxiv.org/abs/2109.11781作者: Marius Paraschiv, Nikos Salamanos, Costas Iordanou, Nikolaos Laoutaris, Michael Sirivianos摘要: 最近的事件表明,通过社会网络传播的虚假信息可能会产生可怕的政治、经济和社会后果。检测虚假信息不可避免地依赖于网络结构、用户特性和事件发生模式。我们提出了一个图数据结构,我们将其表示为元图,它结合了底层用户的关系事件信息,以及语义和主题建模。我们使用涵盖 2016 年美国竞选活动的 Twitter 数据详细构建示例元图,然后将使用众所周知的图神经网络算法在级联级别检测虚假信息与应用于元图节点的相同算法进行比较.比较显示,与基本级联分类相比,使用元图时,在所有考虑的算法中,准确度提高了 3%-4%,在考虑主题建模和情感分析时,准确率进一步提高了 1%。我们对另外两个数据集 HealthRelease 和 HealthStory(FakeHealth 数据集存储库的一部分)进行了相同的实验,结果一致。最后,我们讨论了我们方法的进一步优势,例如使用外部数据源增强图结构的能力,可以轻松组合多个元图以及我们的方法与其他基于图的虚假信息检测的比较构架。知识图嵌入如何外推到看不见的数据:语义证据视图原文标题: How Does Knowledge Graph Embedding Extrapolate to Unseen Data: a Semantic Evidence View地址: http://arxiv.org/abs/2109.11800作者: Ren Li, Yanan Cao, Qiannan Zhu, Guanqun Bi, Fang Fang, Yi Liu, Qian Li摘要: 知识图嵌入(KGE)旨在学习实体和关系的表示。大多数 KGE 模型都取得了巨大的成功,尤其是在外推场景中。具体来说,给定一个不可见的三元组 (h, r, t),经过训练的模型仍然可以从 (h, r, ?) 或 (?, r, t) 中正确预测出 t,这种外推能力令人印象深刻。然而,大多数现有的 KGE 工作都集中在精细的三元建模函数的设计上,主要告诉我们如何测量观察到的三元组的似然性,但我们对为什么这些方法可以外推到看不见的数据以及重要的因素有哪些理解有限帮助 KGE 推断。因此,在这项工作中,我们试图从数据相关的角度来研究 KGE 外推两个问题: 1. KGE 如何外推到看不见的数据? 2、如何设计外推能力更好的KGE模型?对于问题 1,我们首先分别从关系、实体和三重层面讨论外推的影响因素,提出了三个语义证据 (SE),可以从训练集中观察到,并为外推到看不见的数据提供重要的语义信息。然后我们通过对几种典型 KGE 方法的大量实验验证了 SE 的有效性,并证明了 SE 在理解 KGE 外推能力方面起着重要作用。对于问题 2,为了更好地利用 SE 信息进行更多的外推知识表示,我们提出了一种新的基于 GNN 的 KGE 模型,称为语义证据感知图神经网络 (SE-GNN)。最后,通过对 FB15k-237 和 WN18RR 数据集的大量实验,我们表明 SE-GNN 在知识图谱完成任务上达到了最先进的性能,并具有更好的外推能力。声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在公众号“网络科学研究速递”(netsci)和个人博客进行同步更新。