Publications

* indicates equal contribution

Preprints

When Attention Closes: How LLMs Lose the Thread in Multi-Turn Interaction
Vardhan Dongre, Joseph Hsieh, Viet Dac Lai, Seunghyun Yoon, Trung Bui, Dilek Hakkani-Tür
Preprint. 2026.
AcquisitionSynthesis: Targeted Data Generation using Acquisition Functions
Ishika Agarwal, Sofia Stoica, Emre Can Acikgoz, Pradeep Natarajan, Mahdi Namazifar, Jiaqi Ma, Dilek Hakkani-Tür
Preprint. 2026.
Embodied Multi-Agent Coordination by Aligning World Models Through Dialogue
Vardhan Dongre, Dilek Hakkani-Tür
Preprint. 2026.
Measuring and Mitigating the Distributional Gap Between Real and Simulated User Behaviors
Shuhaib Mehri, Philippe Laban, Sumuk Shashidhar, Marwa Abdulhai, Sergey Levine, Michel Galley, Dilek Hakkani-Tür
Preprint. 2026.
Few-Shot Accent Synthesis for ASR with LLM-Guided Phoneme Editing
Yurii Halychanskyi, Nimet Beyza Bozdag, Mark Hasegawa-Johnson, Dilek Hakkani-Tür, Volodymyr Kindratenko
Preprint. 2026.
PSI-Bench: Towards Clinically Grounded and Interpretable Evaluation of Depression Patient Simulators
Nguyen Khoi Hoang, Shuhaib Mehri, Tse-An Hsu, Yi-Jyun Sun, Quynh Xuan Nguyen Truong, Khoa D Doan, Dilek Hakkani-Tür
Preprint. 2026.
Too Polite to Disagree: Understanding Sycophancy Propagation in Multi-Agent Systems
Vira Kasprova, Amruta Parulekar, Abdulrahman AlRabah, Krishna Agaram, Ritwik Garg, Sagar Jha, Nimet Beyza Bozdag, Dilek Hakkani-Tur
Preprint. 2026.
User Preference Modeling for Conversational LLM Agents: Weak Rewards from Retrieval-Augmented Interaction
Yuren Hao, Shuhaib Mehri, ChengXiang Zhai, Dilek Hakkani-Tür
Preprint. 2026.
Sparking Scientific Creativity via LLM-Driven Interdisciplinary Inspiration
Priyanka Kargupta, Shuhaib Mehri, Dilek Hakkani-Tur, Jiawei Han
Preprint. 2026.
Tool-R0: Self-Evolving LLM Agents for Tool-Learning from Zero Data
Emre Can Acikgoz, Cheng Qian, Jonas Hübotter, Heng Ji, Dilek Hakkani-Tür, Gokhan Tur
Preprint. 2026.
ATOD: An Evaluation Framework and Benchmark for Agentic Task-Oriented Dialogue System
Yifei Zhang, Hooshang Nayyeri, Rinat Khaziev, Emine Yilmaz, Gokhan Tur, Dilek Hakkani-Tür, Hari Thadakamalla
Preprint. 2026.
A Rising Tide Lifts All Boats: MTQE Rewards for Idioms Improve General Translation Quality
Ishika Agarwal, Zhenlin He, Dhruva Patil, Dilek Hakkani-Tür
Preprint. 2026.
Learning User Preferences Through Interaction for Long-Term Collaboration
Shuhaib Mehri, Priyanka Kargupta, Tal August, Dilek Hakkani-Tür
Preprint. 2026.
Drift No More? Context Equilibria in Multi-Turn LLM Interactions
Vardhan Dongre, Ryan A Rossi, Viet Dac Lai, David Seunghyun Yoon, Dilek Hakkani-Tür, Trung Bui
Preprint. 2025.
Combinatorial Creativity: A New Frontier in Generalization Abilities
Samuel Schapiro*, Sumuk Shashidhar*, Alexi Gladstone, Jonah Black, Royce Moon, Dilek Hakkani-Tür, Lav R Varshney
Preprint. 2025.
MOCHA: Are Code Language Models Robust Against Multi-Turn Malicious Coding Prompts?
Muntasir Wahed, Xiaona Zhou, Kiet A. Nguyen, Tianjiao Yu, Nirav Diwan, Gang Wang, Dilek Hakkani-Tür, Ismini Lourentzou
Preprint. 2025.
DocCHA: Towards LLM-Augmented Interactive Online diagnosis System
Xinyi Liu, Dachun Sun, Yi R. Fung, Dilek Hakkani-Tür, Tarek Abdelzaher
Preprint. 2025.
Language Specific Knowledge: Do Models Know Better in X than in English?
Ishika Agarwal*, Nimet Beyza Bozdag*, Dilek Hakkani-Tür
Preprint. 2025.
A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions
Emre Can Acikgoz*, Cheng Qian*, Hongru Wang*, Vardhan Dongre, Xiusi Chen, Heng Ji, Dilek Hakkani-Tür, Gokhan Tur
Preprint. 2025.
LLMs are Vulnerable to Malicious Prompts Disguised as Scientific Language
Yubin Ge*, Neeraja Kirtane*, Hao Peng, Dilek Hakkani-Tür
Preprint. 2025.

Accepted

AURA: A Diagnostic Framework for Tracking User Satisfaction of Interactive Planning Agents
Takyoung Kim*, Janvijay Singh*, Shuhaib Mehri*, Emre Can Acikgoz, Sagnik Mukherjee, Nimet Beyza Bozdag, Sumuk Shashidhar, Gokhan Tur, Dilek Hakkani-Tür
IEEE Transactions on Audio, Speech and Language Processing (TASLP). 2026.
Do We Need Adam? Surprisingly Strong and Sparse Reinforcement Learning with SGD in LLMs
Sagnik Mukherjee, Lifan Yuan, Pavan Jayasinha, Dilek Hakkani-Tür, Hao Peng
International Conference on Machine Learning (ICML, Oral). 2026.
DialDefer: A Framework for Detecting and Mitigating LLM Dialogic Deference
Parisa Rabbani, Priyam Sahoo, Ruben Mathew, Aishee Mondal, Harshita Ketharaman, Nimet Beyza Bozdag, Dilek Hakkani-Tür
Annual Meeting of the Association for Computational Linguistics (ACL). 2026.
Current Agents Fail to Leverage World Model as Tool for Foresight
Cheng Qian, Emre Can Acikgoz, Bingxuan Li, Xiusi Chen, Yuji Zhang, Bingxiang He, Qinyu Luo, Dilek Hakkani-Tür, Gokhan Tur, Yunzhu Li, Heng Ji
Annual Meeting of the Association for Computational Linguistics (ACL). 2026.
Do LLMs Encode Functional Importance of Reasoning Tokens?
Janvijay Singh, Dilek Hakkani-Tür
Annual Meeting of the Association for Computational Linguistics (ACL). 2026.
From Documents to Segments: A Contextual Reformulation for Topic Assignment
Hoonsang Yoon*, Takyoung Kim*, Wonkee Lee, Ilmin Cho, Dilek Hakkani-Tür, Stanley Jungkyu Choi.
Annual Meeting of the Association for Computational Linguistics (ACL, Findings). 2026.
TT-SI: Self-Improving LLM Agents with Test-Time Training
Emre Can Acikgoz, Cheng Qian, Heng Ji, Dilek Hakkani-Tür, Gokhan Tur
Annual Meeting of the Association for Computational Linguistics (ACL, Findings). 2026.
Prior Beliefs Prejudice LLM-as-Judge: Evidence from Persuasion Evaluation
Pardis Sadat Zahraei, Xiaoning Wang, Nimet Beyza Bozdag, Gokhan Tur, Dilek Hakkani-Tür
Annual Meeting of the Association for Computational Linguistics (ACL, Findings). 2026.
ReIn: Conversational Error Recovery with Reasoning Inception
Takyoung Kim, Jinseok Nam, Chandrayee Basu, Xing Fan, Chengyuan Ma, Heng Ji, Gokhan Tur, Dilek Hakkani-Tür
International Conference on Learning Representations (ICLR). 2026.
On the Shelf Life of Fine-Tuned LLM Judges: Future Proofing, Backward Compatibility, and Question Generalization
Janvijay Singh, Austin Xu, Yilun Zhou, Yefan Zhou, Dilek Hakkani-Tur, Shafiq Joty
International Conference on Learning Representations (ICLR). 2026.
Must Read: A Systematic Survey of Computational Persuasion
Nimet Beyza Bozdag, Shuhaib Mehri, Xiaocheng Yang, Hyeonjeong Ha, Zirui Cheng, Esin Durmus, Jiaxuan You, Heng Ji, Gokhan Tur, Dilek Hakkani-Tür
ACM Computing Surveys. 2026.
Beyond Sample-Level Feedback: Using Reference-Level Feedback to Guide Data Synthesis
Shuhaib Mehri, Xiusi Chen, Heng Ji, Dilek Hakkani-Tür
European Chapter of the Association for Computational Linguistics (EACL). 2026.
SpeakRL: Synergizing Reasoning, Speaking, and Acting in Language Models with Reinforcement Learning
Emre Can Acikgoz, Jinoh Oh, Jie Hao, Joo Hyuk Jeon, Heng Ji, Dilek Hakkani-Tür, Gokhan Tur, Xiang Li, Chengyuan Ma, Xing Fan
International Workshop on Spoken Dialogue Systems (IWSDS). 2026.
MAC: A Multi-Agent Framework for Interactive User Clarification in Multi-turn Conversations
Emre Can Acikgoz, Jinoh Oh, Joo Hyuk Jeon, Jie Hao, Heng Ji, Dilek Hakkani-Tür, Gokhan Tur, Xiang Li, Chengyuan Ma, Xing Fan
International Workshop on Spoken Dialogue Systems (IWSDS). 2026.
From Fact to Judgment: Investigating the Impact of Task Framing on LLM Conviction in Dialogue Systems
Parisa Rabbani, Nimet Beyza Bozdag, Dilek Hakkani-Tür
International Workshop on Spoken Dialogue Systems (IWSDS). 2026.
Goal Alignment in LLM-Based User Simulators for Conversational AI
Shuhaib Mehri, Xiaocheng Yang, Takyoung Kim, Gokhan Tur, Shikib Mehri, Dilek Hakkani-Tür
Transactions of the Association for Computational Linguistics (TACL). 2026.
Persuade Me if You Can: A Framework for Evaluating Persuasion Effectiveness and Susceptibility Among Large Language Models
Nimet Beyza Bozdag, Shuhaib Mehri, Gokhan Tur, Dilek Hakkani-Tür
Neural Information Processing Systems (NeurIPS) Workshop on Multi-Turn Interactions in Large Language Models. 2025.
Spark: A System for Scientifically Creative Idea Generation
Aishik Sanyal, Samuel Schapiro, Sumuk Shashidhar, Royce Moon, Lav R. Varshney, Dilek Hakkani-Tür
International Conference on Computational Creativity (ICCC). 2025.
Plan Verification for LLM-Based Embodied Task Completion Agents
Ananth Hariharan, Vardhan Dongre, Dilek Hakkani-Tür, Gokhan Tur
Neural Information Processing Systems (NeurIPS) Workshop on Embodied World Models for Decision Making. 2025.
SIMU: Selective Influence Machine Unlearning
Anu Agarwal, Mihir Pamnani, Dilek Hakkani-Tür
Neural Information Processing Systems (NeurIPS) Workshop on Constrained Optimization for Machine Learning (COML). 2025.
Conversational Agents in the Era of Large Language Models [Perspectives]
Emre Can Acikgoz, Dilek Hakkani-Tür, Gokhan Tur
IEEE Signal Processing Magazine. 2025.
MIRAGE: A Benchmark for Multimodal Information-Seeking and Reasoning in Agricultural Expert-Guided Conversations
Vardhan Dongre*, Chi Gui*, Shubham Garg, Hooshang Nayyeri, Gokhan Tur, Dilek Hakkani-Tür, Vikram S. Adve
Neural Information Processing Systems (NeurIPS) Datasets and Benchmarks Track. 2025.
ToolRL: Reward is All Tool Learning Needs
Cheng Qian, Emre Can Acikgoz, Qi He, Hongru Wang, Xiusi Chen, Dilek Hakkani-Tür, Gokhan Tur, Heng Ji
Neural Information Processing Systems (NeurIPS). 2025.
Neural Networks for Learnable and Scalable Influence Estimation of Instruction Fine-Tuning Data
Ishika Agarwal, Dilek Hakkani-Tür
Neural Information Processing Systems (NeurIPS). 2025.
Reinforcement Learning Finetunes Small Subnetworks in Large Language Models
Sagnik Mukherjee, Lifan Yuan, Dilek Hakkani-Tür, Hao Peng
Neural Information Processing Systems (NeurIPS). 2025.
Question Generation for Assessing Early Literacy Reading Comprehension
Xiaocheng Yang, Sumuk Shashidhar, Dilek Hakkani-Tür
Workshop on Speech and Language Technology in Education (SLaTE). 2025
YourBench: Easy Custom Evaluation Sets for Everyone
Sumuk Shashidhar, Clémentine Fourrier, Alina Lozovskia, Thomas Wolf, Gokhan Tur, Dilek Hakkani-Tür
Conference on Language Modeling (COLM). 2025.
TD-EVAL: Revisiting Task-Oriented Dialogue Evaluation by Combining Turn-Level Precision with Dialogue-Level Comparisons
Emre Can Acikgoz*, Carl Guo*, Suvodip Dey*, Akul Datta, Takyoung Kim, Gokhan Tur, Dilek Hakkani-Tür
Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL). 2025.
Uncovering Cross-Domain Recommendation Ability of Large Language Models
Xinyi Liu, Ruijie Wang, Dachun Sun, Dilek Hakkani-Tür, Tarek Abdelzaher
Companion Proceedings of the ACM on Web Conference (WWW) 2025. 2025.
Enabling Chatbots with Eyes and Ears: An Immersive Multimodal Conversation System for Dynamic Interactions
Jihyoung Jang*, Minwook Bae*, Minji Kim, Dilek Hakkani-Tür, Hyounghun Kim
Annual Meeting of the Association for Computational Linguistics (ACL). 2025.
Can a Single Model Master Both Multi-turn Conversations and Tool Use? CoALM: A Unified Conversational Agentic Language Model
Emre Can Acikgoz, Jeremiah Greer, Akul Datta, Ze Yang, William Zeng, Oussama Elachqar, Emmanouil Koukoumidis, Dilek Hakkani-Tür, Gokhan Tur
Annual Meeting of the Association for Computational Linguistics (ACL). 2025.
Know Your Mistakes: Towards Preventing Overreliance on Task-Oriented Conversational AI Through Accountability Modeling
Suvodip Dey, Yi-Jyun Sun, Gokhan Tur, Dilek Hakkani-Tür
Annual Meeting of the Association for Computational Linguistics (ACL). 2025.
SMART: Self-Aware Agent for Tool Overuse Mitigation
Cheng Qian*, Emre Can Acikgoz*, Hongru Wang, Xiusi Chen, Avirup Sil, Dilek Hakkani-Tür, Gokhan Tur, Heng Ji
Annual Meeting of the Association for Computational Linguistics (ACL, Findings). 2025.
Premise-Augmented Reasoning Chains Improve Error Identification in Math reasoning with LLMs
Sagnik Mukherjee*, Abhinav Chinta*, Takyoung Kim, Tarun Anoop Sharma, Dilek Hakkani-Tür
International Conference on Machine Learning (ICML). 2025.
Better Slow than Sorry: Introducing Positive Friction for Reliable Dialogue Systems
Mert İnan, Anthony Sicilia, Suvodip Dey, Vardhan Dongre, Tejas Srinivasan, Jesse Thomason, Gökhan Tür, Dilek Hakkani-Tür, Malihe Alikhani
Transactions of the Association for Computational Linguistics (TACL). 2025.
ReSpAct: Harmonizing Reasoning, Speaking, and Acting Towards Building Large Language Model-Based Conversational AI Agents
Vardhan Dongre, Xiaocheng Yang, Emre Can Acikgoz, Suvodip Dey, Gokhan Tur, Dilek Hakkani-Tür
International Workshop of Spoken Dialogue Systems (IWSDS). 2025.
DELIFT: Data Efficient Language model Instruction Fine Tuning
Ishika Agarwal, Krishnateja Killamsetty, Lucian Popa, Marina Danilevksy
International Conference on Learning Representations (ICLR). 2025.
Learning to Explore and Select for Coverage-Conditioned Retrieval-Augmented Generation
Takyoung Kim, Kyungjae Lee, Young Rok Jang, Ji Yong Cho, Gangwoo Kim, Minseok Cho, Moontae Lee
Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL, Findings). 2025.
Infogent: An Agent-based Framework for Web Information Aggregation
Revanth Gangi Reddy*, Sagnik Mukherjee*, Jeonghwan Kim*, Zhenhailong Wang*, Dilek Hakkani-Tür, Heng Ji
Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL, Findings). 2025.
From Context to Action: Analysis of the Impact of State Representation and Context on Generalizability of Multi-Turn Web Navigation Agents
Nalin Tiwary*, Vardhan Dongre*, Sanil Chawala, Ashwin Lamani, Dilek Hakkani-Tür
Neural Information Processing Systems (NeurIPS) Workshop on Open-World Agents. 2024.
Simulating User Agents for Embodied Conversational AI
Daniel Phillipov, Vardhan Dongre, Gokhan Tur, Dilek Hakkani-Tür
Neural Information Processing Systems (NeurIPS) Workshop on Open-World Agents. 2024.
Instruct, Not Assist: LLM-based Multi-Turn Planning and Hierarchical Questioning for Socratic Code Debugging
Priyanka Karagupta*, Ishika Agarwal*, Dilek Hakkani-Tür, Jiawei Han
Empirical Methods in Natural Language Processing (EMNLP, Findings). 2024.
Cultural Conditioning or Placebo? On the Effectiveness of Socio-Demographic Prompting
Sagnik Mukherjee*, Muhammad Farid Adilazuarda*, Sunayana Sitaram, Kalika Bali, Alham Fikri Aji, Monojit Choudhury
Empirical Methods in Natural Language Processing (EMNLP). 2024.
Towards Measuring and Modeling “Culture” in LLMs: A Survey
Muhammad Farid Adilazuarda*, Sagnik Mukherjee*, Pradhyumna Lavania, Siddhant Singh, Alham Fikri Aji, Jacki O’Neill, Ashutosh Modi, Monojit Choudhury
Empirical Methods in Natural Language Processing (EMNLP). 2024.
Unsupervised Human Preference Learning
Sumuk Shashidhar, Abhinav Chinta, Vaibhav Sahai, Dilek Hakkani-Tür
Empirical Methods in Natural Language Processing (EMNLP). 2024.
Large Language Models as User Agents for Evaluating Task-Oriented-Dialogue Systems
Taaha Kazi, Ruiliang Lyu, Sizhe Zhou, Dilek Hakkani-Tür, Gokhan Tur
IEEE Spoken Language Technology Workshop (IEEE SLT). 2024.
Confidence Estimation for LLM-Based Dialogue State Tracking
Yi-Jyun Sun, Suvodip Dey, Dilek Hakkani-Tür, Gokhan Tur
IEEE Spoken Language Technology Workshop (IEEE SLT). 2024.
Dialog Flow Induction for Constrainable LLM-Based Chatbots
Stuti Agrawal, Nishi Uppuluri, Pranav Pillai, Revanth Gangi Reddy, Zoey Li, Gokhan Tur, Dilek Hakkani-Tür, Heng Ji
Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL). 2024.