Multi-agent generative AI for concept evaluation: consistency, knowledge integration and human alignment

doi:10.1017/pds.2026.10603

DOI: 10.1017/pds.2026.10603 ISSN: 2732-527X

Multi-agent generative AI for concept evaluation: consistency, knowledge integration and human alignment

Mas’udah, Pavel Livotov, Björn R. Kokoschko, Wanyu Xu, Immanuel Hendra, Niklas Hartmann

ABSTRACT:

Early-stage concept evaluation is critical for selecting viable designs. This study introduces a multi-agent generative AI framework for assessing concepts across four configurations: AI with retrieval-augmented knowledge, AI without external knowledge, human experts, and a hybrid approach. The findings show that AI panels tend to produce uniform evaluation patterns, while retrieval-augmented knowledge alters rating behaviour without leading to closer alignment with human judgement. Hybrid setting achieved closest alignment, indicating AI is effective when combined with expert interpretation.

More from our Archive

DOI: 10.1242/jeb.252227 2026
When repair mechanisms fail to keep up: high UVB irradiance causes disproportionate accumulation of DNA lesions
Niclas U. Lundsgaard, Craig E. Franklin, Rebecca L. Cramp
DOI: 10.1177/23996544261466050 2026
Writing against erasure: A geography of resistance in Gaza
Lubna Ahmad Abu Sitta
DOI: 10.1148/rg.250085 2026
Early Pancreatic Cancer: Clinical Implications, Workup, and Imaging Findings with Histopathologic Correlation for Personalized Surveillance
Shintaro Kano, Wataru Gonoi, Moto Nakaya, Shohei Inui, Yudai Nakai, Sota Masuoka, Tomohiko Masumoto, Manabu Minami, Ayman H. Gaballah, Osamu Abe
DOI: 10.1017/pds.2026.10666 2026
Challenges in understanding, using, and teaching design methods: perspectives of design educators
Mayank Mayookh, V. Srinivasan
DOI: 10.1136/bmj-2026-100016 2026
Venous thromboembolism after mechanical restraint in psychiatric hospitals: population based cohort and self-controlled case series study
Jakob Hansen Viuff, Lars Pedersen, Irene Petersen, Jan P Vandenbroucke, Søren Dinesen Østergaard, Henrik Toft Sørensen
DOI: 10.1097/olq.0000000000002356 2026
The Potential for Combined Treponemal/Nontreponemal Rapid Point-of-Care Test and Treponema pallidum Polymerase Chain Reaction in the Diagnosis of Gestational and Congenital Syphilis in a Low-Resource, High-Prevalence Setting: Pilot Data From Malawi
Deirdre J Foley, Vita Nyasulu, Chifundo Kondoni, Annie Kuyere, Fatima Mtonga, George Shaba, James Jafali, Chelsea Morroni, Michael Marks, Patrick Mallon, David Lissauer, Gladys Gadama, Luis Gadama, Kondwani Kawaza, Charlotte van der Veer, Bridget Freyne
DOI: 10.1097/olq.0000000000002347 2026
Advancements in Syphilis Vaccine Development
Lorenzo Giacani, Caroline E. Cameron, Feijun Zhao, Melissa J. Caimano, Justin D. Radolf
DOI: 10.1097/olq.0000000000002353 2026
Evaluation of Partner Notification Strategies to Improve Syphilis Management in Pregnancy in Blantyre, Malawi: A Mixed-Methods Study
Kondwani Kaitume Kaunda, Deirdre J. Foley, Michael Marks, Annielisa Majamanda, Monica Patricia Malata, Catherine Bamuya, Chifundo Kondoni, Gladys Membe Gadama, David Lissauer, Chelsea Morroni, Peter MacPherson, Effie Chipeta, Linda Mipando, Brynne Gilmore, Bridget Freyne
DOI: 10.1097/olq.0000000000002331 2026
Potential Strategies for Participation and Community Engagement in Syphilis Clinical Research
Mitch M. Matoga, Suzanne Day, Dan Wu, Zhuoheng Yin, Bolin Cao, Zou Huachun, Barbara Van Der Pol, Joseph D. Tucker
DOI: 10.1097/olq.0000000000002349 2026
Key Considerations in Evaluating Syphilis Therapeutics
Lisa Frigati, Laurens Manning, Michael Marks, Oriol Mitjà, Thomas Fitzpatrick, Pingyu Zhou