Sobhan Miryoosefi

Citado por

	Total	Desde 2019
Citas	417	417
Índice h	5	5
Índice i10	5	5

160

120

2020202120222023202413 57 143 138 64

Acceso público

Ver todo

1 artículo

0 artículos

disponibles

no disponibles

Basado en requisitos de financiación

Coautores

Chi JinAssistant Professor, Princeton UniversityDirección de correo verificada de princeton.edu
Miroslav DudikMicrosoft ResearchDirección de correo verificada de microsoft.com
Kianté BrantleyCornell UniversityDirección de correo verificada de cornell.edu
Qinghua LiuPrinceton UniversityDirección de correo verificada de princeton.edu
Hal Daumé IIIAssociate Professor of Computer Science, University of MarylandDirección de correo verificada de umiacs.umd.edu
Robert SchapireMicrosoft ResearchDirección de correo verificada de microsoft.com
Wen SunAssistant Professor, Cornell UniversityDirección de correo verificada de cornell.edu
Thodoris LykourisMITDirección de correo verificada de mit.edu
MAX SIMCHOWITZMITDirección de correo verificada de mit.edu
Aleksandrs SlivkinsSenior Principal Researcher, Microsoft Research NYCDirección de correo verificada de microsoft.com
Sanjiv KumarGoogle Fellow, VP, Google ResearchDirección de correo verificada de google.com
Yonathan EfroniMeta, New YorkDirección de correo verificada de fb.com
Akshay KrishnamurthyUniversity of Massachusetts AmherstDirección de correo verificada de cs.umass.edu
Satyen KaleResearch Scientist, Google ResearchDirección de correo verificada de google.com
Sashank J. ReddiResearch Scientist, Google ResearchDirección de correo verificada de cs.cmu.edu
Daliang LiAnthropicDirección de correo verificada de anthropic.com
Manzil ZaheerGoogle ResearchDirección de correo verificada de cmu.edu
Zonglin LiGoogle ResearchDirección de correo verificada de google.com

Seguir

Sobhan Miryoosefi

Google Research

Dirección de correo verificada de google.com - Página principal

Machine Learning Theoretical Machine Learning Reinforcement Learning Natural Language Processing


Título Ordenar por citas Ordenar por año Ordenar por título	Citado por Citado por	Año
Bellman Eluder dimension: New rich classes of RL problems, and sample-efficient algorithms C Jin, Q Liu, S Miryoosefi Advances in Neural Information Processing Systems 34, 13406-13418, 2021	213	2021
Reinforcement learning with convex constraints S Miryoosefi, K Brantley, H Daumé III, M Dudík, R Schapire Advances in Neural Information Processing Systems 32, 14093-14102, 2019	93	2019
Constrained episodic reinforcement learning in concave-convex and knapsack settings K Brantley, M Dudik, T Lykouris, S Miryoosefi, M Simchowitz, A Slivkins, ... Advances in Neural Information Processing Systems 33, 16315-16326, 2020	48	2020
Provable reinforcement learning with a short-term memory Y Efroni, C Jin, A Krishnamurthy, S Miryoosefi International Conference on Machine Learning, 5832-5850, 2022	29	2022
A simple reward-free approach to constrained reinforcement learning S Miryoosefi, C Jin International Conference on Machine Learning, 15666-15698, 2022	27	2022
Rest meets react: Self-improvement for multi-step reasoning llm agent R Aksitov, S Miryoosefi, Z Li, D Li, S Babayan, K Kopparapu, Z Fisher, ... arXiv preprint arXiv:2312.10003, 2023	5	2023
Efficient training of language models using few-shot learning SJ Reddi, S Miryoosefi, S Karp, S Krishnan, S Kale, S Kim, S Kumar International Conference on Machine Learning, 14553-14568, 2023	2	2023
Efficient Stagewise Pretraining via Progressive Subnetworks A Panigrahi, N Saunshi, K Lyu, S Miryoosefi, S Reddi, S Kale, S Kumar arXiv preprint arXiv:2402.05913, 2024		2024
Provable Reinforcement Learning with Constraints and Function Approximation SSM Yoosefi Princeton University, 2022		2022

El sistema no puede realizar la operación en estos momentos. Inténtalo de nuevo más tarde.

Artículos 1–9

Citas por año

Citas duplicadas

Citas combinadas

Añadir coautoresCoautores

Seguir

Citado por

Coautores