18.2 — Wprowadzenie do iteratorów

Iteracja po tablicy (lub innej strukturze) danych jest dość powszechną rzeczą robić w programowaniu. Jak dotąd omówiliśmy wiele różnych sposobów, aby to zrobić: za pomocą pętli i indeksu (for-loops i while loops), wskaźników i arytmetyki wskaźników oraz range-based for-loops:

#include <array>
#include <cstddef>
#include <iostream>

int main()
{
    // W C++17 typ zmiennej arr jest dedukowany na std::array<int, 7>
    // Jeśli podczas kompilacji tego przykładu wystąpił błąd, zobacz ostrzeżenie poniżej
    std::array arr{ 0, 1, 2, 3, 4, 5, 6 };
    std::size_t length{ std::size(arr) };

    // pętla while z jawnym indeksem
    std::size_t index{ 0 };
    while (index < length)
    {
        std::cout << arr[index] << ' ';
        ++index;
    }
    std::cout << '\n';

    // pętla for z jawnym indeksem
    for (index = 0; index < length; ++index)
    {
        std::cout << arr[index] << ' ';
    }
    std::cout << '\n';

    // pętla for ze wskaźnikiem (Uwaga: ptr nie może być stałą, ponieważ ją zwiększamy)
    for (auto ptr{ &arr[0] }; ptr != (&arr[0] + length); ++ptr)
    {
        std::cout << *ptr << ' ';
    }
    std::cout << '\n';

    // oparty na zakresie dla pętli
    for (int i : arr)
    {
        std::cout << i << ' ';
    }
    std::cout << '\n';

    return 0;
}

Ostrzeżenie

W przykładach w tej lekcji wykorzystano funkcję C++17 zwaną class template argument deduction w celu wydedukowania argumentów szablonu zmiennej szablonu z jej inicjatora. W powyższym przykładzie, gdy kompilator zobaczy std::array arr{ 0, 1, 2, 3, 4, 5, 6 };, wywnioskuje, że chcemy std::array<int, 7> arr { 0, 1, 2, 3, 4, 5, 6 };.

Jeśli Twój kompilator nie obsługuje C++ 17, pojawi się błąd mówiący coś w rodzaju „brak argumentów szablonu przed „arr””. W takim przypadku najlepiej będzie włączyć C++ 17, zgodnie z lekcją 0.12 — Konfigurowanie kompilatora: Wybieranie standardu językowego. Jeśli nie możesz, możesz zastąpić linie korzystające z dedukcji argumentów szablonu klasy liniami, które mają jawne argumenty szablonu (np. zamień std::array arr{ 0, 1, 2, 3, 4, 5, 6 }; z std::array<int, 7> arr { 0, 1, 2, 3, 4, 5, 6 };

Pętla z użyciem indeksów wymaga więcej pisania niż potrzeba, jeśli używamy indeksu tylko do uzyskania dostępu do elementów. Działa to również tylko wtedy, gdy kontener (np. tablica) zapewnia bezpośredni dostęp do elementów (co robią tablice, ale niektóre inne typy kontenerów, takie jak listy, nie).

Pętla z wskaźniki i arytmetyka wskaźników jest gadatliwa i może być myląca dla czytelników, którzy nie znają zasad arytmetyki wskaźników. Arytmetyka wskaźników działa również tylko wtedy, gdy elementy znajdują się w pamięci po sobie (co dotyczy tablic, ale nie dotyczy innych typów kontenerów, takich jak listy, drzewa i mapy).

Dla zaawansowanych czytelników

Wskaźniki (bez arytmetyki wskaźników) mogą być również używane do iteracji po niektórych elementach. struktury niesekwencyjne. Na liście połączonej każdy element jest połączony z poprzednim elementem za pomocą wskaźnika. Możemy iterować po liście, podążając za łańcuchem wskaźników.

Pętle for oparte na zakresach są nieco bardziej interesujące, ponieważ mechanizm iteracji po naszym kontenerze jest ukryty - a mimo to nadal działają w przypadku wszelkiego rodzaju różnych struktur (tablic, list, drzew, map itp.). iteratory.

Iteratory

iterator to obiekt przeznaczony do przechodzenia przez kontener (np. wartości w tablicy lub znaki w ciągu znaków), zapewniający po drodze dostęp do każdego elementu.

Kontener może udostępniać różne rodzaje iteratorów Na przykład kontener tablicy może oferować iterator do przodu, który przechodzi przez tablicę w kolejności do przodu, oraz iterator odwrotny, który przechodzi przez tablicę w odwrotnej kolejności.

Po utworzeniu odpowiedniego typu iteratora programista może następnie używać interfejsu dostarczonego przez iterator do przeglądania elementów i uzyskiwania dostępu do nich bez konieczności martwienia się o rodzaj wykonywanego przechodzenia lub w jaki sposób dane są przechowywane w kontenerze. A ponieważ iteratory C++ zazwyczaj używają tego samego interfejsu do przechodzenia (operator++ do przejścia do następnego elementu) i dostępu (operator* do uzyskiwania dostępu do elementu). bieżący element), możemy iterować po wielu różnych typach kontenerów, stosując spójną metodę.

Wskaźniki jako iterator

Najprostszym rodzajem iteratora jest wskaźnik, który (przy użyciu arytmetyki wskaźników) działa dla danych przechowywanych sekwencyjnie w pamięci. Przyjrzyjmy się ponownie prostemu przechodzeniu przez tablicę przy użyciu arytmetyki wskaźników i wskaźników:

#include <array>
#include <iostream>

int main()
{
    std::array arr{ 0, 1, 2, 3, 4, 5, 6 };

    auto begin{ &arr[0] };
    // zauważ, że to wskazuje na jedno miejsce poza ostatnim elementem
    auto end{ begin + std::size(arr) };

    // pętla for ze wskaźnikiem
    for (auto ptr{ begin }; ptr != end; ++ptr) // ++ aby przejść do następnego elementu
    {
        std::cout << *ptr << ' '; // Pośredniość do pobrania wartości bieżącego elementu
    }
    std::cout << '\n';

    return 0;
}

Wyjście:

0 1 2 3 4 5 6

In. powyżej zdefiniowaliśmy dwie zmienne: begin (która wskazuje początek naszego kontenera) i end (która wyznacza punkt końcowy). W przypadku tablic znacznikiem końcowym jest zazwyczaj miejsce w pamięci, w którym znajdowałby się ostatni element, gdyby kontener zawierał jeszcze jeden element.

Wskaźnik następnie wykonuje iterację pomiędzy begin i end, a dostęp do bieżącego elementu można uzyskać poprzez wyłuskanie elementu wskaźnik.

Ostrzeżenie

Możesz ulec pokusie obliczenia znacznika końca przy użyciu operatora adresu i składni tablicy w następujący sposób:

int* end{ &arr[std::size(arr)] };

Ale powoduje to niezdefiniowane zachowanie, ponieważ arr[std::size(arr)] w sposób dorozumiany usuwa referencje do elementu znajdującego się poza końcem tablicy.

Zamiast tego użyj:

int* end{ arr.data() + std::size(arr) }; // data() zwraca wskaźnik do pierwszy element

Iteratorów standardowych bibliotek

Iteracja jest tak powszechną operacją że wszystkie standardowe kontenery bibliotek oferują bezpośrednie wsparcie dla iteracji. Zamiast obliczać własne punkty początkowe i końcowe, możemy po prostu zapytać kontener o punkty początkowe i końcowe za pomocą funkcji składowych o wygodnej nazwie begin() i end():

#include <array>
#include <iostream>

int main()
{
    std::array array{ 1, 2, 3 };

    // Zapytaj naszą tablicę o punkty początkowe i końcowe (poprzez funkcje elementu początkowego i końcowego).
    auto begin{ array.begin() };
    auto end{ array.end() };

    for (auto p{ begin }; p != end; ++p) // ++ aby przejść do następnego elementu.
    {
        std::cout << *p << ' '; // Pośrednia do pobrania wartości bieżącego elementu.
    }
    std::cout << '\n';

    return 0;
}

Wypisuje:

1 2 3

Klasa iterator nagłówek zawiera również dwie funkcje ogólne (std::begin i std::end), których można użyć.

Wskazówka

std::begin i std::end w stylu C tablice są zdefiniowane w nagłówku <iterator>.

std::begin i std::end w przypadku kontenerów obsługujących iteratory są zdefiniowane w plikach nagłówkowych tych kontenerów (np. <array>, <vector>).

#include <array>    // includes <iterator>
#include <iostream>

int main()
{
    std::array array{ 1, 2, 3 };

    // Użyj std::begin i std::end, aby uzyskać punkty początkowe i końcowe.
    auto begin{ std::begin(array) };
    auto end{ std::end(array) };

    for (auto p{ begin }; p != end; ++p) // ++ aby przejść do następnego elementu
    {
        std::cout << *p << ' '; // Pośredniość do pobrania wartości bieżącego elementu
    }
    std::cout << '\n';

    return 0;
}

To również wypisuje:

1 2 3

Nie przejmuj się na razie typami iteratorów, wrócimy do iteratorów w późniejszym rozdziale. Ważne jest to, że iterator dba o szczegóły iteracji po kontenerze. Potrzebujemy tylko czterech rzeczy: punktu początkowego, punktu końcowego, operatora++ do przeniesienia iteratora do następnego elementu (lub końca) i operatora* do pobrania wartości bieżącego elementu.

operator< vs operator!= W przypadku iteratorów

W lekcji 8.10 -- Dla instrukcji zauważyliśmy, że użycie operator< było preferowane zamiast operator!= podczas wykonywania porównań numerycznych w warunku pętli:

    for (index = 0; index < length; ++index)

Z iteratorów, zwykle używa się operator!= do sprawdzenia, czy iterator osiągnął element końcowy:

    for (auto p{ begin }; p != end; ++p)

Dzieje się tak, ponieważ niektóre typy iteratorów nie są relacyjne porównywalne. operator!= działa ze wszystkimi typami iteratorów.

Powrót do pętli for opartych na zakresach

Wszystkie typy, które mają obie begin() i end() funkcje składowe lub których można używać z std::begin() i std::end(), można używać w pętlach for opartych na zakresach.

#include <array>
#include <iostream>

int main()
{
    std::array array{ 1, 2, 3 };

    // Działa dokładnie tak samo jak pętla, której używaliśmy wcześniej.
    for (int i : array)
    {
        std::cout << i << ' ';
    }
    std::cout << '\n';

    return 0;
}

Za kulisami wywołania pętli for oparte na zakresach begin() i end() typu, po którym można iterować. std::array has begin i end funkcje składowe, dzięki czemu możemy ich używać w pętli opartej na zakresach. Stałych tablic w stylu C można używać z funkcjami std::begin i std::end , więc możemy je przeglądać również za pomocą pętli opartej na zakresie. Dynamiczne tablice w stylu C (lub tablice w stylu C) nie działają, ponieważ nie ma dla nich std::end funkcji (ponieważ informacja o typie nie zawiera długości tablicy).

Jak dodać te funkcje do typów dowiesz się później, aby można było ich używać również z pętlami for opartymi na zakresach.

Pętle for oparte na zakresach nie są najlepszym rozwiązaniem jedyna rzecz, która korzysta z iteratorów. Są one również używane w std::sort i innych algorytmach. Teraz, gdy już wiesz, czym one są, zauważysz, że są często używane w bibliotece standardowej.

Unieważnianie iteratorów (iteratory wiszące)

Podobnie jak wskaźniki i referencje, iteratory mogą pozostać „zawieszone”, jeśli elementy poddawane iteracji zmienią adres lub zostaną zniszczone. Gdy tak się stanie, mówimy, że iterator został unieważniają. Dostęp do unieważnionego iteratora powoduje niezdefiniowane zachowanie.

Niektóre operacje modyfikujące kontenery (takie jak dodanie elementu do std::vector) mogą mieć efekt uboczny w postaci spowodowania zmiany adresów elementów w kontenerze. Kiedy tak się stanie, istniejące iteratory tych elementów zostaną unieważnione. Dobra dokumentacja referencyjna C++ powinna zawierać informacje, które operacje kontenerowe mogą lub spowodują unieważnienie iteratorów. Jako przykład zobacz sekcję „Unieważnianie iteratora” w std::vector na temat cppreference.

Ponieważ pętle for oparte na zakresach używają iteratorów za kulisami, musimy uważać, aby nie zrobić niczego, co unieważnia iteratory kontenera, przez który aktywnie przechodzimy:

#include <vector>

int main()
{
    std::vector v { 0, 1, 2, 3 };

    for (auto num : v) // niejawnie iteruje po v
    {
        if (num % 2 == 0)
            v.push_back(num + 1); // kiedy to unieważniło iteratory v, wystąpi niezdefiniowane zachowanie
    }

    return 0;
}

Oto kolejny przykład iteratora unieważnienie:

#include <iostream>
#include <vector>

int main()
{
	std::vector v{ 1, 2, 3, 4, 5, 6, 7 };

	auto it{ v.begin() };

	++it; // przejdź do drugiego elementu
	std::cout << *it << '\n'; // ok: prints 2

	v.erase(it); // usuń aktualnie wykonywany element over

	// erase() unieważnia iteratory do usuniętego elementu (i kolejnych elementów)
	// więc iterator „it” jest teraz unieważniany

	++it; // undefined behavior
	std::cout << *it << '\n'; // undefined behavior

	return 0;
}

Unieważnione iteratory można ponownie sprawdzić, przypisując im prawidłowy iterator (np. begin(), end() lub wartość zwracaną przez inną funkcję, która zwraca iterator).

Klasa erase() zwraca iterator do elementu pierwszego za usuniętym elementem (lub end() jeśli ostatni element został usunięty). Dlatego możemy naprawić powyższy kod w następujący sposób:

#include <iostream>
#include <vector>

int main()
{
	std::vector v{ 1, 2, 3, 4, 5, 6, 7 };

	auto it{ v.begin() };

	++it; // przejdź do drugiego elementu
	std::cout << *it << '\n';

	it = v.erase(it); // usuń element aktualnie poddawany iteracji, ustaw `it` na następny element

	std::cout << *it << '\n'; // OK, teraz wypisuje 3

	return 0;
}

Następna lekcja

18.3Wprowadzenie do algorytmów bibliotek standardowych

Powrót do spisu treści

Poprzednia lekcja

18.1Sortowanie tablicy za pomocą sortowania przez wybór

(h/t do nascarddriver za znaczący wkład w tę lekcję)