Число вхождений элементов однгого массива в другом. - Мир MS Excel

Регистрация

Напомнить пароль

= Мир MS Excel/Число вхождений элементов однгого массива в другом. - Мир MS Excel

Страница 1 из 2 1 2 »
Модератор форума: китин, _Boroda_, DrMini

Число вхождений элементов однгого массива в другом. (Макросы Sub)

Число вхождений элементов однгого массива в другом.

Дата: Суббота, 27.07.2013, 14:08 | Сообщение № 1

Группа: Друзья

Ранг: Старожил

Сообщений: 2012

Репутация: 373 ±

Замечаний: 0% ±

Excel2016

Всем здрасте.
Интересует наиболее быстрый алгоритм вычисления числа вхождения элементов одного массива в другой.
Конкретно в моем случае, массивы - это натуральные числа, для упрощения скажем от1 до 20
В примере у меня есть решение через встроенные функции, и через VBA.
Есть ли более быстрые алгоритмы?

зы. Функция у меня для примера алгоритма, в действительности это будет макрос и работа не с ячейками, а с массивами. Надо провести несколько миллионов сравнений.

К сообщению приложен файл: Count_in.xls (71.0 Kb)

Ответить

Дата: Суббота, 27.07.2013, 14:51 | Сообщение № 2

Группа: Друзья

Ранг: Старожил

Сообщений: 2012

Репутация: 373 ±

Замечаний: 0% ±

Excel2016

Что-то просмотров мало, наверно потому, что сегодня выходной.
Повторил тему на Планете

Ответить

Дата: Суббота, 27.07.2013, 14:53 | Сообщение № 3

Группа: Друзья

Ранг: Старожил

Сообщений: 1206

Репутация: 255 ±

Замечаний: 0% ±

2010

[offtop]Я посмотрел и понял, что мне до уровня решения данной задачи еще пару лет опыта набираться )

skypro1111@gmail.com

Ответить

Дата: Суббота, 27.07.2013, 15:40 | Сообщение № 4

Группа: Проверенные

Ранг: Обитатель

Сообщений: 301

Репутация: 15 ±

Замечаний: 0% ±

Excel 2007

Michael_S, измените например значение ячейки С1 с 3 на 20 и получите разные результаты (5 и 4) в двух формулах

Сообщение отредактировал SergeyKorotun - Суббота, 27.07.2013, 15:43

Ответить

Дата: Суббота, 27.07.2013, 15:46 | Сообщение № 5

Группа: Друзья

Ранг: Старожил

Сообщений: 2012

Репутация: 373 ±

Замечаний: 0% ±

Excel2016

SergeyKorotun, забыл указать, что хоть числа и случайны, но в пределах одного массива уникальны.

Ответить

Матраскин

Дата: Суббота, 27.07.2013, 16:27 | Сообщение № 6

Группа: Друзья

Ранг: Обитатель

Сообщений: 375

Репутация: 81 ±

Замечаний: 0% ±

20xx

Michael_S, если возможна сортировка 2ого массив то я бы:
отсортировал
и потом при сравнении с первым доходил не до конца 2 ого массив, а делал проверку А может ли там быть этот элемент?

20 4 5 5 19 14 15 12
18 20 14 5 10 19

первый проход до конца
второй выбывает ^_^

^_^

третий 1 раз
и т д

думаю быстрей будет

в интернете опять кто-то не прав

Сообщение отредактировал Матраскин - Суббота, 27.07.2013, 16:32

Ответить

Дата: Суббота, 27.07.2013, 19:46 | Сообщение № 7

Группа: Друзья

Ранг: Старожил

Сообщений: 2012

Репутация: 373 ±

Замечаний: 0% ±

Excel2016

Матраскин, в принципе оба массива отсортированы по возрастанию... вот только по проходам я не пронял...
в моем вариант всего 8=6=14 циклов, какой алгоритм вы предлагаете?

Ответить

Матраскин

Дата: Суббота, 27.07.2013, 19:59 | Сообщение № 8

Группа: Друзья

Ранг: Обитатель

Сообщений: 375

Репутация: 81 ±

Замечаний: 0% ±

20xx

Michael_S, берём элемент №1 массива№1 сравниваем с элементом №1 массива №2. Если этот элемент < элемента №1 массива№2, то сравниваем с элементом №2 массива№2. Если больше то конец цикла, элемента элемент №1 массива№1 нет в массиве №2. Если равен - то элемент найден, счётчик увеличивается на +1 и выходим из цикла.

И так повторяем пока не закончиться массив №1

p.s. массив №2 отсорт. по возрастанию

в интернете опять кто-то не прав

Сообщение отредактировал Матраскин - Суббота, 27.07.2013, 20:02

Ответить

Дата: Суббота, 27.07.2013, 21:33 | Сообщение № 9

Группа: Проверенные

Ранг: Обитатель

Сообщений: 301

Репутация: 15 ±

Замечаний: 0% ±

Excel 2007

Если массив отсортирован, можно применить метод половинного деления.
Берем средний элемент во втором массиве и сравниваем с элементом с первого массива. Если элементы равны, счетчик увеличиваем и переходим к поиску следующего элемента с первого массива, иначе определяем в какой части второго массива может быть элемент с первого массива и снова делим его пополам и т.д. до тех пор пока или элементы будут равны или размер части второго массива станет = 1.

Ответить

Дата: Вторник, 30.07.2013, 03:13 | Сообщение № 10

Группа: Админы

Ранг: Старожил

Сообщений: 2008

Репутация: 752 ±

Замечаний: ±

Варианты, предложанные на Планете не смотрел, предложу свои
Если данных очень много, лучше работать на массивах

Вариант 1, принцип такой же как и у тебя, создаем массив флагов, и пробегаем по одному массиву и по другому
Достоинства: небольшое количество итераций, сложность O(n+m), не требует сортировки данных
Недостатки: может потребоватся большое количество памяти, в зависимости от значений в массивах, работает только с целыми числами

Вариант 2, в основе принцип предложенный Матраскиным, оба массива отсортированы по возрастанию,
пробегаем по первому массиву, сравниваеваем с элементами второго, до тех пор, пока элемент второго массива не будет равен первому, или превышать, пока не закончатся данные, при этом следущий элемент первого массива сравнивается не с начала второго массива, а с запомненного смещения, тем самым обеспечивается меньшее кол-во итерций, не превышающее n+m
Достоинства: небольшое количество итераций, сложность O(n+m) в худшем случае, не требует выделение памяти, может работать с целыми и дробными числами, а также со строковыми переменными, отсортированными по возрастанию
Недостатки: данные должны быть отсортированы по возрастанию

Т.к. сложность алгоритмов линейна в обоих вариантах, и количество итераций не превышает n+m, то сравнение двух массивов по миллиону элементов составляет доли секунды, второй варинт получился быстрее (в зависимости от данных)

Варианты, предложанные на Планете не смотрел, предложу свои
Если данных очень много, лучше работать на массивах

Вариант 1, принцип такой же как и у тебя, создаем массив флагов, и пробегаем по одному массиву и по другому
Достоинства: небольшое количество итераций, сложность O(n+m), не требует сортировки данных
Недостатки: может потребоватся большое количество памяти, в зависимости от значений в массивах, работает только с целыми числами

Вариант 2, в основе принцип предложенный Матраскиным, оба массива отсортированы по возрастанию,
пробегаем по первому массиву, сравниваеваем с элементами второго, до тех пор, пока элемент второго массива не будет равен первому, или превышать, пока не закончатся данные, при этом следущий элемент первого массива сравнивается не с начала второго массива, а с запомненного смещения, тем самым обеспечивается меньшее кол-во итерций, не превышающее n+m
Достоинства: небольшое количество итераций, сложность O(n+m) в худшем случае, не требует выделение памяти, может работать с целыми и дробными числами, а также со строковыми переменными, отсортированными по возрастанию
Недостатки: данные должны быть отсортированы по возрастанию

Т.к. сложность алгоритмов линейна в обоих вариантах, и количество итераций не превышает n+m, то сравнение двух массивов по миллиону элементов составляет доли секунды, второй варинт получился быстрее (в зависимости от данных)MCH

К сообщению приложен файл: Count_in2.xlsb (87.4 Kb)

Сообщение отредактировал MCH - Вторник, 30.07.2013, 07:50

Ответить

СообщениеВарианты, предложанные на Планете не смотрел, предложу свои
Если данных очень много, лучше работать на массивах

Вариант 1, принцип такой же как и у тебя, создаем массив флагов, и пробегаем по одному массиву и по другому
Достоинства: небольшое количество итераций, сложность O(n+m), не требует сортировки данных
Недостатки: может потребоватся большое количество памяти, в зависимости от значений в массивах, работает только с целыми числами

Вариант 2, в основе принцип предложенный Матраскиным, оба массива отсортированы по возрастанию,
пробегаем по первому массиву, сравниваеваем с элементами второго, до тех пор, пока элемент второго массива не будет равен первому, или превышать, пока не закончатся данные, при этом следущий элемент первого массива сравнивается не с начала второго массива, а с запомненного смещения, тем самым обеспечивается меньшее кол-во итерций, не превышающее n+m
Достоинства: небольшое количество итераций, сложность O(n+m) в худшем случае, не требует выделение памяти, может работать с целыми и дробными числами, а также со строковыми переменными, отсортированными по возрастанию
Недостатки: данные должны быть отсортированы по возрастанию

Т.к. сложность алгоритмов линейна в обоих вариантах, и количество итераций не превышает n+m, то сравнение двух массивов по миллиону элементов составляет доли секунды, второй варинт получился быстрее (в зависимости от данных)

Автор - MCH
Дата добавления - 30.07.2013 в 03:13

Дата: Вторник, 30.07.2013, 16:17 | Сообщение № 11

Группа: Проверенные

Ранг: Обитатель

Сообщений: 301

Репутация: 15 ±

Замечаний: 0% ±

Excel 2007

Хотелось бы кроме затраченного времени увидеть и количество операций сравнения элементов.

Ответить

Дата: Вторник, 30.07.2013, 17:39 | Сообщение № 12

Группа: Админы

Ранг: Старожил

Сообщений: 2008

Репутация: 752 ±

Замечаний: ±

Цитата (SergeyKorotun, 30.07.2013 в 16:17, в сообщении №11)

Хотелось бы кроме затраченного времени увидеть и количество операций сравнения элементов

Что Вам мешает сделать счетчик и вывести в окно Immediate?

Принципиально не стал это делать, чтобы не производилась дополнительная задержка на счет счетчика

Ответить

Дата: Вторник, 30.07.2013, 17:56 | Сообщение № 13

Группа: Админы

Ранг: Старожил

Сообщений: 2008

Репутация: 752 ±

Замечаний: ±

Сделал счетчик

К сообщению приложен файл: Count_in3.xlsb (70.4 Kb)

Сообщение отредактировал MCH - Вторник, 30.07.2013, 18:04

Ответить

Дата: Вторник, 30.07.2013, 18:41 | Сообщение № 14

Группа: Гости

[quote=MCH]Что Вам мешает сделать счетчик и вывести в окно Immediate?[/quote]
только собираюсь начинать изучать VBA
[quote=MCH]Сделал счетчик[/quote]
не вижу

Ответить

Дата: Вторник, 30.07.2013, 20:12 | Сообщение № 15

Группа: Редакторы

Ранг: Обитатель

Сообщений: 431

Репутация: 193 ±

Замечаний: 0% ±

Цитата (Michael_S, 27.07.2013 в 14:08, в сообщении №1)

Число вхождений элементов однгого массива в другом

см. операции со множествами (пересечение, разность ...)

в php для этого даже есть функции специальные

http://www.php.net/manual/ru/function.array-intersect.php
http://php.net/manual/ru/function.array-diff.php

можно сорцы посмотреть

p.s/: если речь идет о данных, проще использовать sql http://www.excelworld.ru/forum/4-4334-1

Чебурашка стал символом олимпийских игр. А чего достиг ты?
Тишина - самый громкий звук

YM 41001156540584 / WM WMR R21924176233

https://github.com/nervgh/vba

Сообщение отредактировал nerv - Вторник, 30.07.2013, 20:15

Ответить

Дата: Воскресенье, 04.08.2013, 16:19 | Сообщение № 16

Группа: Друзья

Ранг: Старожил

Сообщений: 2012

Репутация: 373 ±

Замечаний: 0% ±

Excel2016

Снова всем здравствуйте!
Появилось немного времени и желания вновь вернуться к этой теме. Прежде всего спасибо всем ответившим.
Есть интересные предложения для общего случая небольших массивов данных, но ... из преложенных наиболее подходящим будет "Вариант 2", предложенный MCH.

В файле пример с частичной реализацией.
После разрешения макросов произойдет загрузка тиражей за 2013 год.
Если после загрузки нажать кнопку "Обновить все", а потом еще раз запустить макрос - будет таблица всех тиражей.

К сообщению приложен файл: 5_from_36.xlsm (64.8 Kb)

Сообщение отредактировал Michael_S - Воскресенье, 04.08.2013, 16:23

Ответить

Дата: Воскресенье, 04.08.2013, 16:54 | Сообщение № 17

Группа: Админы

Ранг: Старожил

Сообщений: 2008

Репутация: 752 ±

Замечаний: ±

Миш, а озвучь какую задачу хочешь решить, с точки зрения комбинаторики возможно интересно будет порешать.
500 млн чисел (376992 * 1340) для массивов - плевое дело перебрать.

Не ради лотереи, а ради комбинаторики могу помочь.

Ответить

Дата: Воскресенье, 04.08.2013, 17:47 | Сообщение № 18

Группа: Друзья

Ранг: Старожил

Сообщений: 2012

Репутация: 373 ±

Замечаний: 0% ±

Excel2016

Миш, да задача пока, на первом этапе, простая.
Для лисов Пары-Четверки показать, когда и сколько выпадала эта комбинация;
для "Все" показать кол-во совпадений каждого варианта в каждом тираже.
Есть у меня (в мозгах) еще один алгоритм, там кол-во переборов в два раза меньше, но не уверен, что в общем случае это будет быстрее.

Да и, честно говоря - скорость обработки здесь не решающий фактор. Пусть даже, при первом расчете будет обрабатывать сутки (хотя думаю, что даже на не самом оптимальном алгоритме займет не более часа), потом только добавлять вновь появившиеся данные. Была бы от этого хоть какая-то (материальная) польза - уже б сделал. А так - только моральное удовлетворение, ...и немалые материальные потери, если на эти расчеты положиться.
А если и повезет - то не благодаря расчетам

Сообщение отредактировал Michael_S - Воскресенье, 04.08.2013, 17:48

Ответить

Дата: Воскресенье, 04.08.2013, 17:56 | Сообщение № 19

Группа: Админы

Ранг: Местный житель

Сообщений: 16475

Репутация: 2750 ±

Замечаний: ±

Excel 2016

И ты Брут...

ЮMoney:41001419691823 | WMR:126292472390

Ответить

Дата: Воскресенье, 04.08.2013, 18:08 | Сообщение № 20

Группа: Админы

Ранг: Старожил

Сообщений: 2008

Репутация: 752 ±

Замечаний: ±

Цитата (Michael_S, 04.08.2013 в 17:47, в сообщении №18)

Да и, честно говоря - скорость обработки здесь не решающий фактор.

Думаю что для задач двойки, тройки, четверки - перебор займет секунды

Твой файл не смотрел, но могу предложить следующий алгоритм
Для пар: генерируем выборку 2 из 36, проверяем все 630 (36*35/2) вариантов на 1340 тиражей, сортируем по убыванию и выводим на экран, с указанием номеров тиражей, где совпадало
Для троек аналогично, только времени затратится больше: 7140 вариантов (36*35*34/6), для четверок - 58905 вариантов
Но учитывая, что количество вариантов не такое уж и большое, то времени затратится немного

Ответить

Число вхождений элементов однгого массива в другом. (Макросы Sub)

Страница 1 из 2
1
2
»

© 2010-2026 · Дизайн: MichaelCH · Хостинг от uCoz · При использовании материалов сайта, ссылка на www.excelworld.ru обязательна!