Ziang Song

20212022202320243 30 61 31

Acceso público

2 artículos

0 artículos

disponibles

no disponibles

Basado en requisitos de financiación

Song MeiAssistant Professor at UC BerkeleyDirección de correo verificada de berkeley.edu
Yu BaiResearch Scientist, Salesforce ResearchDirección de correo verificada de salesforce.com
Tianle CaiPhD Student, Princeton UniversityDirección de correo verificada de princeton.edu
Tiancheng YuTwo SigmaDirección de correo verificada de mit.edu
Chi JinAssistant Professor, Princeton UniversityDirección de correo verificada de princeton.edu
Weijie SuAssociate Professor, University of PennsylvaniaDirección de correo verificada de wharton.upenn.edu
Jason D. LeeAssociate Professor of Electrical Engineering and Computer Science, Princeton UniversityDirección de correo verificada de princeton.edu

Ziang Song

Dirección de correo verificada de stanford.edu


Título Ordenar por citas Ordenar por año Ordenar por título	Citado por Citado por	Año
When can we learn general-sum Markov games with a large number of players sample-efficiently? Z Song, S Mei, Y Bai arXiv preprint arXiv:2110.04184, 2021	88	2021
Efficient Phi-Regret Minimization in Extensive-Form Games via Online Mirror Descent Y Bai, C Jin, S Mei, Z Song, T Yu Advances in Neural Information Processing Systems 35, 22313-22325, 2022	13	2022
Reward collapse in aligning large language models Z Song, T Cai, JD Lee, WJ Su arXiv preprint arXiv:2305.17608, 2023	12	2023
Sample-efficient learning of correlated equilibria in extensive-form games Z Song, S Mei, Y Bai Advances in Neural Information Processing Systems 35, 4099-4110, 2022	11	2022
Reward Collapse in Aligning Large Language Models: A Prompt-Aware Approach to Preference Rankings Z Song, T Cai, JD Lee, WJ Su ICML 2023 Workshop The Many Facets of Preference-Based Learning, 2023	1	2023

El sistema no puede realizar la operación en estos momentos. Inténtalo de nuevo más tarde.

Artículos 1–5

Citas por año