Matteo Papini

Cited by

	All	Since 2019
Citations	798	781
h-index	13	13
i10-index	14	14

200

100

150

201720182019202020212022202320245 11 34 110 148 177 193 118

Public access

View all

10 articles

0 articles

available

not available

Based on funding mandates

Co-authors

Marcello RestelliAssociate Professor, Politecnico di MilanoVerified email at polimi.it
Alberto Maria MetelliAssistant Professor, Politecnico di MilanoVerified email at polimi.it
Matteo PirottaResearch Scientist, Meta (FAIR)Verified email at fb.com
Andrea TirinzoniMetaVerified email at fb.com
Gergely NeuArtificial Intelligence and Machine Learning group, Universitat Pompeu FabraVerified email at upf.edu
Alessandro LazaricResearch Scientist, Facebook Artificial Intelligence ResearchVerified email at inria.fr
Giuseppe CanonacoJP Morgan AI ResearchVerified email at jpmorgan.com
Damiano BinaghiArtificialyVerified email at artificialy.com
Pierluca D'OroMila & MetaVerified email at mila.quebec
Francesco FaccioThe Swiss AI Lab IDSIA / USI & SUPSI, KAUST AI InitiativeVerified email at idsia.ch
Mario BerahaDepartment of Mathematics, Politecnico di MilanoVerified email at polimi.it
Lorenzo BisiAI Specialist, ML cubeVerified email at polimi.it
Edoardo Vittori, PhDIntesa SanpaoloVerified email at polimi.it
Luca SabbioniPolitecnico di MilanoVerified email at polimi.it
Nico MontaliWaymo ResearchVerified email at google.com
Lorenzo LupoLaboratoire d'Informatique de GrenobleVerified email at univ-grenoble-alpes.fr
Julia OlkhovskayaTU DelftVerified email at tudelft.nl
Ludovic SchwartzPhD Student at UPF BarcelonaVerified email at upf.edu
Aldo PacchianoBroad Institute of MIT and HarvardVerified email at broadinstitute.org
Nneka OkoloUniversitat Pompeu FabraVerified email at upf.edu

Matteo Papini

Politecnico di Milano

Verified email at polimi.it - Homepage

Reinforcement Learning Machine Learning Artificial Intelligence


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Stochastic variance-reduced policy gradient M Papini, D Binaghi, G Canonaco, M Pirotta, M Restelli Proceedings of the 35th International Conference on Machine Learning 80 …, 2018	193	2018
Policy optimization via importance sampling AM Metelli, M Papini, F Faccio, M Restelli Advances in Neural Information Processing Systems 31, 2018	107	2018
Feature selection via mutual information: New theoretical insights M Beraha, AM Metelli, M Papini, A Tirinzoni, M Restelli 2019 international joint conference on neural networks (IJCNN), 1-9, 2019	86	2019
Risk-averse trust region optimization for reward-volatility reduction L Bisi, L Sabbioni, E Vittori, M Papini, M Restelli arXiv preprint arXiv:1912.03193, 2019	65	2019
Importance sampling techniques for policy optimization AM Metelli, M Papini, N Montali, M Restelli Journal of Machine Learning Research 21 (141), 1-75, 2020	57	2020
Adaptive batch size for safe policy gradients M Papini, M Pirotta, M Restelli Advances in neural information processing systems 30, 2017	47	2017
Gradient-aware model-based policy search P D'Oro, AM Metelli, A Tirinzoni, M Papini, M Restelli Proceedings of the AAAI Conference on Artificial Intelligence 34 (04), 3801-3808, 2020	45	2020
Optimistic policy optimization via multiple importance sampling M Papini, AM Metelli, L Lupo, M Restelli International Conference on Machine Learning, 4989-4999, 2019	39	2019
Smoothing policies and safe policy gradients M Papini, M Pirotta, M Restelli Machine Learning 111 (11), 4081-4137, 2022	38	2022
Leveraging good representations in linear contextual bandits M Papini, A Tirinzoni, M Restelli, A Lazaric, M Pirotta International Conference on Machine Learning, 8371-8380, 2021	28	2021
Reinforcement learning in linear mdps: Constant regret and representation selection M Papini, A Tirinzoni, A Pacchiano, M Restelli, A Lazaric, M Pirotta Advances in Neural Information Processing Systems 34, 16371-16383, 2021	19	2021
Balancing learning speed and stability in policy gradient via adaptive exploration M Papini, A Battistello, M Restelli International conference on artificial intelligence and statistics, 1188-1199, 2020	17	2020
Lifting the information ratio: An information-theoretic analysis of thompson sampling for contextual bandits G Neu, I Olkhovskaia, M Papini, L Schwartz Advances in Neural Information Processing Systems 35, 9486-9498, 2022	13	2022
Policy optimization as online learning with mediator feedback AM Metelli, M Papini, P D'Oro, M Restelli Proceedings of the AAAI Conference on Artificial Intelligence 35 (10), 8958-8966, 2021	13	2021
Offline primal-dual reinforcement learning for linear mdps G Gabbianelli, G Neu, M Papini, NM Okolo International Conference on Artificial Intelligence and Statistics, 3169-3177, 2024	8	2024
Importance-weighted offline learning done right G Gabbianelli, G Neu, M Papini International Conference on Algorithmic Learning Theory, 614-634, 2024	4	2024
Online adversarial mdps with off-policy feedback and known transitions F Bacchiocchi, FE Stradi, M Papini, AM Metelli, N Gatti Sixteenth European Workshop on Reinforcement Learning, 2023	4	2023
Online learning with off-policy feedback G Gabbianelli, G Neu, M Papini International Conference on Algorithmic Learning Theory, 620-641, 2023	3	2023
Scalable representation learning in linear contextual bandits with constant regret guarantees A Tirinzoni, M Papini, A Touati, A Lazaric, M Pirotta Advances in Neural Information Processing Systems 35, 2307-2319, 2022	3	2022
Automated Reasoning for Reinforcement Learning Agents in Structured Environments. A Gianola, M Montali, M Papini OVERLAY@ GandALF, 43-48, 2021	3	2021

The system can't perform the operation now. Try again later.

Articles 1–20

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by

Co-authors