聊天机器人的采用:多视角的系统回顾和未来的研究议程

文献笔记
人机交互
CASA
作者

周博霖

发布于

June 7, 2025

参考文献

Alsharhan, A., Al-Emran, M., & Shaalan, K. (2024). Chatbot Adoption: A Multiperspective Systematic Review and Future Research Agenda. Ieee Transactions on Engineering Management, 71, 10232-10244. https://doi.org/10.1109/tem.2023.3298360

Alsharhan et al. (2024)

1 引言

  • 对话代理(conversational agent)也就是聊天机器人(Chat-bot)

  • 技术接受分为个人和组织两个层次,个人层次自愿,组织层次带有强制性

  • 常见模型是技术接受模型(TAM)和技术接受和使用统一理论及其拓展(UTAUT2)

  • 探索以下内容

    研究对象 目的
    主要理论和模型 理论框架优缺点
    地理分布 识别地域趋势和偏见
    自变量、因变量、调节变量 识别潜在变量
    应用领域 识别潜在领域
    方法论 评估稳健性
    被试分布 评估代表性

2 相关研究

表 1: 前人综述研究
研究目的 时间区间 纳入研究量 领域
消费者对聊天机器人采纳的态度 2016-2019 12 通用领域
聊天机器人在多大程度上能够改变有害行为 1966-2019 110 通用领域
聊天机器人在减肥方面的应用以及影响用户参与度的因素 -2021 23 医疗保健
聊天机器人对用户忠诚度的影响 1990-2021 41 通用领域
医疗保健领域中会话代理的可用性和有效性 2008-2019 31 医疗保健
消费者使用智能代理技术的驱动因素 2000-2020 107 通用领域
用户对聊天机器人采纳的行为意向 2017-2021 39 通用领域

3 方法

  • systematic literature review(SLR):参考preferred reporting items for systematic reviews and meta-analyses(PRISMA)(Shamseer et al., 2015)

3.1 纳入和排除标准

表 2: 纳入和排除标准
纳入 排除
与聊天机器人的采纳和使用相关 与聊天机器人的采纳和使用无关
包含带有假设的理论模型 不包含理论模型
关于对话代理(聊天机器人) 关于特定的对话代理,如voice-based agents和embodied virtual agents(机器人)
英文撰写 非英文撰写
已发表的期刊论文、会议论文和带结果的书籍章节 综述、书籍、海报、报告、学位论文、杂志、未报告结果的论文
全文可获得 无法获得

3.2 数据来源和检索策略

  • Emerald、ACM、Science Direct、Springer、Sage、IEEE Xplore、Taylor & Francis 和 Google Scholar

  • “Chatbot” AND (“acceptance” OR “adoption” OR “use” OR “intention” OR “behavior”)

  • 图 1: PRISMA流程图
  • 最后获得219份文献进行分析

3.3 数据收集和分析

1)作者,2)出版年份,3)数据库,4)理论/模型,5)国家和地区,6)因变量,7)外部因素,8)调节变量,9)方法论,10)被试,11)研究层次,12)研究领域

4 结果

4.1 出版年份

图 2: 出版年份

4.2 数据库

图 3: 数据库

4.3 研究层次

图 4: 研究层次

205项研究是个人层次的技术接受,12项是组织层次的,1项是综述,1项是元结构方程模型( meta-analytic structural equation modeling,MSAEM)

4.4 理论/模型

聊天机器人接受研究中使用的主要理论/模型
理论/模型 研究数量
Technology acceptance model (TAM) 43
Social presence theory (SPT) 27
Computers as social actors (CASA) 26
Information systems success model (ISS) 9
Extension of UTAUT (UTAUT2) 8
UTAUT 7
Expectation confirmation theory (ECT) 4
Uses and gratifications theory (U&G) 4
Self-determination theory (SDT) 4
Diffusion of innovations (DOI) 4
Social response theory (SRT) 4
Service quality (SERVQUAL) 4
Uncanny valley of mind (UVM) 4
Media richness theory (MRT) 3
Theory of reasoned action (TRA) 3
Theory of planned behavior (TPB) 3
Cognitive absorption theory (CAT) 3
Behavioral reasoning theory (BRT) 2
Attribution theory (ATT) 2
Expectation-confirmation model of information system (ECM-IS) 2
Stimulus–organism–response model (SOR) 2
Task technology fit (TTF) 2
Theory of consumption values (TCV) 2
Status quo bias (SQB) 2
Expectancy violations theory (EVT) 2
Similarity/attraction theory (SAT) 2
None 55
  • SPT和CASA受到重视,说明TAM可能不足以解释聊天机器人的技术接受

  • 原文展示了各个理论/模型在各个领域研究的数目

    • TAM常用于电子商务、金融、教育和客户服务研究

    • CASA常用于电子商务、客户服务和营销研究

    • SPT常用于营销研究

  • 可考虑其他理论/模型在其他领域的应用

4.5 国家和地区

图 5: 地理分布

国家和地区分布
图 6: 全球分布
  • 15个研究涉及多个国家或地区

  • 美国的大量研究可能不是因为对这个领域感兴趣,而是因为Amazon Mechanical Turk(MTurk)平台便于招募被试

  • 非洲未开发

4.6 主要因变量

前10因变量

4.7 主要自变量

前10额外自变量
  • 筛选标准

    • 出现了两次或两次以上

    • 不是模型/理论中的变量(如TAM里面的感知易用性和感知有用性)

4.8 主要调节变量

图 7: 主要调节变量
  • 63%研究没使用调节变量

4.9 主要研究领域

图 8: 主要研究领域

细分领域
  • 还有12%(26项)研究是应用于通用领域

4.10 主要研究方法

图 9: 主要研究方法

主要统计方法

4.11 被试分布

图 10: 被试分布

5 讨论

  • 研究数量在增加

  • 个人与组织层次研究分布不平衡

  • 传播学理论在兴起

  • 主要集中于亚洲、北美、欧洲,可能是因为这些地区有众包平台

    • 欧洲数量的增加可能要归功于德国
  • 关于实际使用行为和继续使用的研究较少,更多是关注未使用过的和早起使用者

  • 拟人性(anthropomorphism)是常见变量

  • 调节变量值得研究

  • 图 8

6 结论

6.1 研究意义

做了这个研究XD

6.2 未来研究方向

6.2.1 聊天机器人

  1. 聊天机器人如何用于说服或政策合规?

  2. 影响用户对聊天机器人网络安全行为的因素有哪些?

  3. 聊天机器人所带来的安全性和隐私挑战在多大程度上影响用户的采用?

  4. 如何解决安全性和隐私问题,以促进聊天机器人的更广泛应用?

  5. 聊天机器人在农村地区处理医疗紧急情况、缓解老年人孤独感和协助宇航员方面的效率如何?

  6. 聊天机器人在发展中国家的采用驱动因素和障碍有哪些?与发达国家有何不同?

  7. 影响绿色聊天机器人使用的因素以及其对可持续发展的影响有哪些?

  8. 聊天机器人使用对工作表现、社区参与和可持续性的影响是什么?

  9. MASEM方法是否可以用于识别聊天机器人采用文献中的共性或差异?

  10. 在聊天机器人的开发和部署过程中,应该考虑哪些伦理问题,如何有效地解决这些问题以确保负责任的使用?

  11. 在各个领域的组织层面,影响聊天机器人采用的关键因素有哪些?

  12. 聊天机器人在不同组织领域的接受率如何?

6.2.2 Generative AI

  1. 用户如何看待生成式人工智能的潜在风险和收益,这如何影响他们对这些技术的接受?

  2. 影响生成式人工智能持续意愿及其对可持续发展影响的因素有哪些?

  3. 生成式人工智能(如ChatGPT和Google Bard)的引入如何影响教育、医疗、旅游和营销等领域的聊天机器人采用格局?

  4. 生成式人工智能如何转变教学与学习实践,且其对学生的教育成果和参与度有何影响?

  5. 生成式人工智能在心理健康支持方面的应用如何?其在心理健康护理中的采用受哪些因素影响?

  6. 对生成式人工智能的信任程度如何影响其在不同领域个体和组织层面的采用?

  7. 领导力在推动生成式人工智能在各领域组织层面采用中扮演何种角色?

  8. 在促进生成式人工智能在个体和组织层面采用方面,需要哪些培训和支持结构?

  9. 生成式人工智能的使用如何影响个体在不同领域的工作满意度和职业发展?

  10. 组织如何有效地采用生成式人工智能以提升其运营效率?

  11. 不同领域的组织在采用生成式人工智能时面临哪些障碍,如何克服这些障碍?

  12. 生成式人工智能的使用如何影响个体和组织层面的决策过程?

  13. 任务技术适配模型(TTF)如何预测生成式人工智能在个体和组织层面的采用成功率?

6.3 不足

  • 研究范围只包含基于文本的聊天机器人,不包含语音助手等

  • 时间范围不足

  • 检索数据库不足

参考文献

Alsharhan, A., Al-Emran, M., & Shaalan, K. (2024). Chatbot adoption: A multiperspective systematic review and future research agenda. Ieee Transactions on Engineering Management, 71, 10232–10244. https://doi.org/10.1109/tem.2023.3298360
Shamseer, L., Moher, D., Clarke, M., Ghersi, D., Liberati, A., Petticrew, M., Shekelle, P., Stewart, L. A., & Group, P.-P. (2015). Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-p) 2015: Elaboration and explanation. BMJ : British Medical Journal, 349, g7647. https://doi.org/10.1136/bmj.g7647