pandas-dev · alysivji · Jun 11, 2017 · Jun 11, 2017 · Jun 12, 2017 · Jul 19, 2017
diff --git a/doc/source/whatsnew/v0.21.0.txt b/doc/source/whatsnew/v0.21.0.txt
@@ -38,6 +38,7 @@ Other Enhancements
 - :func:`read_feather` has gained the ``nthreads`` parameter for multi-threaded operations (:issue:`16359`)
 - :func:`DataFrame.clip()` and :func: `Series.cip()` have gained an inplace argument. (:issue: `15388`)
 - :func:`crosstab` has gained a ``margins_name`` parameter to define the name of the row / column that will contain the totals when margins=True. (:issue:`15972`)
+- ``pd.read_excel()`` has a ``nrows`` parameter (:issue:`16645`)
 
 .. _whatsnew_0210.api_breaking:
 

diff --git a/pandas/io/excel.py b/pandas/io/excel.py
@@ -82,6 +82,8 @@
     Rows to skip at the beginning (0-indexed)
 skip_footer : int, default 0
     Rows at the end to skip (0-indexed)
+nrows : int, default None
+    Number of rows to parse
 index_col : int, list of ints, default None
     Column (0-indexed) to use as the row labels of the DataFrame.
     Pass None if there is no such column.  If a list is passed,
@@ -191,12 +193,12 @@ def get_writer(engine_name):
 
 
 @Appender(_read_excel_doc)
-def read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0,
-               index_col=None, names=None, parse_cols=None, parse_dates=False,
-               date_parser=None, na_values=None, thousands=None,
-               convert_float=True, converters=None, dtype=None,
-               true_values=None, false_values=None, engine=None,
-               squeeze=False, **kwds):
+def read_excel(io, sheet_name=0, header=0, skiprows=None, nrows=None,
+               skip_footer=0, index_col=None, names=None, parse_cols=None,
+               parse_dates=False, date_parser=None, na_values=None,
+               thousands=None, convert_float=True, converters=None,
+               dtype=None, true_values=None, false_values=None,
+               engine=None, squeeze=False, **kwds):
 
     # Can't use _deprecate_kwarg since sheetname=None has a special meaning
     if is_integer(sheet_name) and sheet_name == 0 and 'sheetname' in kwds:
@@ -211,12 +213,13 @@ def read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0,
         io = ExcelFile(io, engine=engine)
 
     return io._parse_excel(
-        sheetname=sheet_name, header=header, skiprows=skiprows, names=names,
-        index_col=index_col, parse_cols=parse_cols, parse_dates=parse_dates,
-        date_parser=date_parser, na_values=na_values, thousands=thousands,
-        convert_float=convert_float, skip_footer=skip_footer,
-        converters=converters, dtype=dtype, true_values=true_values,
-        false_values=false_values, squeeze=squeeze, **kwds)
+        sheetname=sheet_name, header=header, skiprows=skiprows, nrows=nrows,
+        names=names, index_col=index_col, parse_cols=parse_cols,
+        parse_dates=parse_dates, date_parser=date_parser, na_values=na_values,
+        thousands=thousands, convert_float=convert_float,
+        skip_footer=skip_footer, converters=converters, dtype=dtype,
+        true_values=true_values, false_values=false_values,
+        squeeze=squeeze, **kwds)
 
 
 class ExcelFile(object):
@@ -275,11 +278,11 @@ def __init__(self, io, **kwds):
     def __fspath__(self):
         return self._io
 
-    def parse(self, sheet_name=0, header=0, skiprows=None, skip_footer=0,
-              names=None, index_col=None, parse_cols=None, parse_dates=False,
-              date_parser=None, na_values=None, thousands=None,
-              convert_float=True, converters=None, true_values=None,
-              false_values=None, squeeze=False, **kwds):
+    def parse(self, sheet_name=0, header=0, skiprows=None, nrows=None,
+              skip_footer=0, names=None, index_col=None, parse_cols=None, 
+              parse_dates=False, date_parser=None, na_values=None,
+              thousands=None, convert_float=True, converters=None,
+              true_values=None, false_values=None, squeeze=False, **kwds):
         """
         Parse specified sheet(s) into a DataFrame
 
@@ -288,7 +291,9 @@ def parse(self, sheet_name=0, header=0, skiprows=None, skip_footer=0,
         """
 
         return self._parse_excel(sheetname=sheet_name, header=header,
-                                 skiprows=skiprows, names=names,
+                                 skiprows=skiprows,
+                                 nrow=nrows,
+                                 names=names,
                                  index_col=index_col,
                                  parse_cols=parse_cols,
                                  parse_dates=parse_dates,
@@ -335,12 +340,12 @@ def _excel2num(x):
         else:
             return i in parse_cols
 
-    def _parse_excel(self, sheetname=0, header=0, skiprows=None, names=None,
-                     skip_footer=0, index_col=None, parse_cols=None,
-                     parse_dates=False, date_parser=None, na_values=None,
-                     thousands=None, convert_float=True, true_values=None,
-                     false_values=None, verbose=False, dtype=None,
-                     squeeze=False, **kwds):
+    def _parse_excel(self, sheetname=0, header=0, skiprows=None, nrows=None,
+                     names=None, skip_footer=0, index_col=None,
+                     parse_cols=None, parse_dates=False, date_parser=None,
+                     na_values=None, thousands=None, convert_float=True,
+                     true_values=None, false_values=None, verbose=False,
+                     dtype=None, squeeze=False, **kwds):
 
         skipfooter = kwds.pop('skipfooter', None)
         if skipfooter is not None:
@@ -511,12 +516,13 @@ def _parse_cell(cell_contents, cell_typ):
                                     true_values=true_values,
                                     false_values=false_values,
                                     skiprows=skiprows,
+                                    nrows=nrows,
                                     skipfooter=skip_footer,
                                     squeeze=squeeze,
                                     dtype=dtype,
                                     **kwds)
 
-                output[asheetname] = parser.read()
+                output[asheetname] = parser.read(nrows=nrows)
                 if names is not None:
                     output[asheetname].columns = names
                 if not squeeze or isinstance(output[asheetname], DataFrame):

diff --git a/pandas/io/parsers.py b/pandas/io/parsers.py
@@ -999,6 +999,8 @@ def _failover_to_python(self):
 
     def read(self, nrows=None):
         if nrows is not None:
+            nrows = _validate_integer('nrows', nrows)
+
             if self.options.get('skipfooter'):
                 raise ValueError('skipfooter not supported for iteration')
 
@@ -1893,6 +1895,8 @@ def TextParser(*args, **kwds):
     date_parser : function, default None
     skiprows : list of integers
         Row numbers to skip
+    nrows : int, default None
+        Number of rows to parse
     skipfooter : int
         Number of line at bottom of file to skip
     converters : dict, default None

diff --git a/pandas/tests/io/test_excel.py b/pandas/tests/io/test_excel.py
@@ -1000,6 +1000,20 @@ def test_read_excel_skiprows_list(self):
                                'skiprows_list', skiprows=np.array([0, 2]))
         tm.assert_frame_equal(actual, expected)
 
+    def test_read_excel_nrows(self):
+        # GH 16645
+        num_rows_to_pull = 5
+        actual = pd.read_excel(os.path.join(self.dirpath, 'test1' + self.ext),
+                               nrows=num_rows_to_pull)
+        expected = pd.read_excel(os.path.join(self.dirpath,
+                                              'test1' + self.ext))
+        expected = expected[:num_rows_to_pull]
+        tm.assert_frame_equal(actual, expected)
+
+        with pytest.raises(ValueError):
+            pd.read_excel(os.path.join(self.dirpath, 'test1' + self.ext),
+                          nrows='5')
+
     def test_read_excel_squeeze(self):
         # GH 12157
         f = os.path.join(self.dirpath, 'test_squeeze' + self.ext)