mirror of
https://gitlab.com/MoonTestUse1/AdministrationItDepartmens.git
synced 2025-08-14 00:25:46 +02:00
Починка adm3
This commit is contained in:
166
backend/app/bot/parse_all_chats.py
Normal file
166
backend/app/bot/parse_all_chats.py
Normal file
@@ -0,0 +1,166 @@
|
||||
from telethon import TelegramClient
|
||||
from telethon.tl.types import User, Channel
|
||||
import asyncio
|
||||
import os
|
||||
from typing import List, Set
|
||||
import time
|
||||
|
||||
# Открытые чаты (можно получить список участников)
|
||||
OPEN_CHATS = [
|
||||
'https://t.me/imichatchallenge',
|
||||
'https://t.me/neironutii',
|
||||
'https://t.me/forgetmeai_chat',
|
||||
'https://t.me/incubeaichat',
|
||||
'https://t.me/neyrodev'
|
||||
]
|
||||
|
||||
# Закрытые чаты (получаем через сообщения)
|
||||
CLOSED_CHATS = [
|
||||
'https://t.me/neuroart0',
|
||||
'https://t.me/+szDfPREr1rpjMWRi',
|
||||
'https://t.me/saburov_chat',
|
||||
'https://t.me/integromat_russia',
|
||||
'https://t.me/+V2toPTWQB4RkYWRi'
|
||||
]
|
||||
|
||||
def remove_duplicates_from_file(filename: str) -> None:
|
||||
"""
|
||||
Удаляет дубликаты строк из файла и сохраняет только уникальные значения
|
||||
|
||||
Args:
|
||||
filename (str): Имя файла для обработки
|
||||
"""
|
||||
try:
|
||||
# Проверяем существование файла
|
||||
if not os.path.exists(filename):
|
||||
print(f"Файл {filename} не найден")
|
||||
return
|
||||
|
||||
# Читаем все строки из файла
|
||||
with open(filename, 'r', encoding='utf-8') as file:
|
||||
lines = file.readlines()
|
||||
|
||||
# Подсчитываем начальное количество строк
|
||||
initial_count = len(lines)
|
||||
|
||||
# Создаем множество уникальных строк (удаляем пробелы и пустые строки)
|
||||
unique_lines = set(line.strip() for line in lines if line.strip())
|
||||
|
||||
# Сортируем строки
|
||||
sorted_lines = sorted(unique_lines)
|
||||
|
||||
# Записываем уникальные значения обратно в файл
|
||||
with open(filename, 'w', encoding='utf-8') as file:
|
||||
for line in sorted_lines:
|
||||
file.write(f"{line}\n")
|
||||
|
||||
# Выводим статистику
|
||||
final_count = len(sorted_lines)
|
||||
removed_count = initial_count - final_count
|
||||
print(f"\nУдаление дубликатов из файла {filename}:")
|
||||
print(f"Было строк: {initial_count}")
|
||||
print(f"Стало строк: {final_count}")
|
||||
print(f"Удалено дубликатов: {removed_count}")
|
||||
|
||||
except Exception as e:
|
||||
print(f"Ошибка при обработке файла {filename}: {str(e)}")
|
||||
|
||||
async def get_users_from_participants(client: TelegramClient, chat_link: str) -> Set[str]:
|
||||
"""
|
||||
Получает список пользователей из участников чата (для открытых чатов)
|
||||
"""
|
||||
try:
|
||||
chat = await client.get_entity(chat_link)
|
||||
unique_usernames = set()
|
||||
|
||||
print(f"Получаю список участников из открытого чата {chat_link}...")
|
||||
async for participant in client.iter_participants(chat):
|
||||
if isinstance(participant, User) and not participant.bot and participant.username:
|
||||
unique_usernames.add(f"@{participant.username}")
|
||||
|
||||
print(f"Собрано {len(unique_usernames)} уникальных пользователей из {chat_link}")
|
||||
return unique_usernames
|
||||
|
||||
except Exception as e:
|
||||
print(f"Ошибка при обработке открытого чата {chat_link}: {str(e)}")
|
||||
return set()
|
||||
|
||||
async def get_users_from_messages(client: TelegramClient, chat_link: str) -> Set[str]:
|
||||
"""
|
||||
Получает список пользователей из истории сообщений (для закрытых чатов)
|
||||
"""
|
||||
try:
|
||||
chat = await client.get_entity(chat_link)
|
||||
unique_usernames = set()
|
||||
|
||||
print(f"Получаю сообщения из закрытого чата {chat_link}...")
|
||||
async for message in client.iter_messages(chat, limit=None):
|
||||
if message.sender and isinstance(message.sender, User) and not message.sender.bot:
|
||||
if message.sender.username:
|
||||
unique_usernames.add(f"@{message.sender.username}")
|
||||
|
||||
print(f"Собрано {len(unique_usernames)} уникальных пользователей из {chat_link}")
|
||||
return unique_usernames
|
||||
|
||||
except Exception as e:
|
||||
print(f"Ошибка при обработке закрытого чата {chat_link}: {str(e)}")
|
||||
return set()
|
||||
|
||||
async def main():
|
||||
# Инициализация клиента с заданными параметрами
|
||||
client = TelegramClient(
|
||||
session='anon15',
|
||||
api_id=22454710,
|
||||
api_hash='4eb535b17a9b8b832d985d269944b184',
|
||||
proxy=None,
|
||||
device_model='PC',
|
||||
system_version='1.0',
|
||||
app_version='1.0',
|
||||
lang_code='en',
|
||||
system_lang_code='en',
|
||||
connection_retries=5,
|
||||
auto_reconnect=True,
|
||||
timeout=10
|
||||
)
|
||||
|
||||
await client.start()
|
||||
|
||||
try:
|
||||
all_usernames = set()
|
||||
|
||||
# Обрабатываем открытые чаты
|
||||
print("\nОбработка открытых чатов...")
|
||||
for chat in OPEN_CHATS:
|
||||
try:
|
||||
usernames = await get_users_from_participants(client, chat)
|
||||
all_usernames.update(usernames)
|
||||
await asyncio.sleep(2)
|
||||
except Exception as e:
|
||||
print(f"Не удалось обработать открытый чат {chat}: {str(e)}")
|
||||
|
||||
# Обрабатываем закрытые чаты
|
||||
print("\nОбработка закрытых чатов...")
|
||||
for chat in CLOSED_CHATS:
|
||||
try:
|
||||
usernames = await get_users_from_messages(client, chat)
|
||||
all_usernames.update(usernames)
|
||||
await asyncio.sleep(2)
|
||||
except Exception as e:
|
||||
print(f"Не удалось обработать закрытый чат {chat}: {str(e)}")
|
||||
|
||||
# Сохраняем результаты в файл
|
||||
print(f"\nВсего найдено {len(all_usernames)} уникальных пользователей")
|
||||
with open('bigparsing', 'w', encoding='utf-8') as file:
|
||||
for username in sorted(all_usernames):
|
||||
file.write(f"{username}\n")
|
||||
|
||||
print(f"Результаты сохранены в файл 'bigparsing'")
|
||||
|
||||
# Удаляем дубликаты из файла
|
||||
remove_duplicates_from_file('bigparsing')
|
||||
|
||||
finally:
|
||||
await client.disconnect()
|
||||
|
||||
if __name__ == '__main__':
|
||||
asyncio.run(main())
|
35
backend/app/bot/remove_duplicates.py
Normal file
35
backend/app/bot/remove_duplicates.py
Normal file
@@ -0,0 +1,35 @@
|
||||
def remove_duplicates(filename: str):
|
||||
"""
|
||||
Удаляет дубликаты из файла и сохраняет уникальные значения
|
||||
|
||||
Args:
|
||||
filename (str): Имя файла для обработки
|
||||
"""
|
||||
try:
|
||||
# Читаем все строки из файла
|
||||
with open(filename, 'r', encoding='utf-8') as file:
|
||||
lines = file.readlines()
|
||||
|
||||
# Убираем пробелы и пустые строки, создаем множество уникальных значений
|
||||
unique_lines = set(line.strip() for line in lines if line.strip())
|
||||
|
||||
# Сортируем строки для удобства чтения
|
||||
sorted_lines = sorted(unique_lines)
|
||||
|
||||
# Записываем уникальные значения обратно в файл
|
||||
with open(filename, 'w', encoding='utf-8') as file:
|
||||
for line in sorted_lines:
|
||||
file.write(f"{line}\n")
|
||||
|
||||
print(f"Обработка завершена:")
|
||||
print(f"Было строк: {len(lines)}")
|
||||
print(f"Стало строк: {len(sorted_lines)}")
|
||||
print(f"Удалено дубликатов: {len(lines) - len(sorted_lines)}")
|
||||
|
||||
except FileNotFoundError:
|
||||
print(f"Ошибка: Файл {filename} не найден")
|
||||
except Exception as e:
|
||||
print(f"Произошла ошибка: {str(e)}")
|
||||
|
||||
if __name__ == "__main__":
|
||||
remove_duplicates('userai.txt')
|
Reference in New Issue
Block a user